Você está na página 1de 617

Cálculo Diferencial a Várias Variáveis

Uma Introdução à Teoria de Otimização

Humberto José Bortolossi

E ditor a

PUC
Edições L oyola
Edições Loyola
Rua 1822, n®347 - Ipiranga
04216-000 São Paulo, SP
Caixa Postal 42.335 - 04218-970 São Paulo, SP
Tel.:(0xxl 1)6914-1922
Fax: (Oxxl 1)6163-4275
Home page e vendas: www.loyola.com.br
Editorial: loyola@loyola.com.br
Vendas: vendas@loyola.com.br

Editora PUC-Rio
Rua Marquês de S. Vicente, 225 - Prédio Kennedy, sala 401
Gávea - Rio de Janeiro - RJ - CEP 22451-900
Telefax: (0xx21) 3114-1140/41/42/43
e-mail: edpucrio@vrc.puc-rio.br

Conselho Editorial:
Augusto Sampaio, Cesar Romero Jacob, Danilo Marcondes de Souza Filho, Eneida do Rego
Monteiro Bomfim, Fernando Sá, Gisele Cittadino, José Alberto dos Reis Parise, Miguel Pereira.

Capa e ilustrações: Tina Velho e Bia Amaral

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por
quaisquer meios (eletrônico ou mecânico, incluindo fotocópia e gravação) ou arquivada em qualquer
sistema ou banco de dados sem permissão escrita da Editora.

ISBN: 85-15-02442-X
© Edições Loyola, São Paulo, Brasil, 2002

Boitolossi, Humberto José


Cálculo diferencial a várias variáveis:
uma introdução à teoria de otimização /
Humberto José Bortolossi -
Rio de Janeiro : Ed. PUC-Rio ; São
Paulo : Loyola, 2002.
618 p.; 23 cm. (Coleção Matmídia)
1. Cálculo diferencial. 2. Variáveis.
(Matemática). 3. Otimização matemá­
tica. I. Série. II. Título: Uma introdução à
teoria de otimização. III. Título.

CDD: 515.33
A Coleção de Livros e Softwares^ Matmídia
o Laboratório Matmídia (acrônimo de matemática e multimídia), do Departamento
de Matemática da PUC-Rio, dedica-se atualmente a pesquisas em modelagem geo­
métrica e computação gráfica e a confeccionar softwares, tanto para a indústria do
petróleo quanto para projetos educacionais^. Em sua vertente educacional, o Projeto
Matmídia-Educação, congrega professores que procuram integrar a mídia eletrônica
(CD-ROMs, vídeos, internet) com a tradicional (livros). O Projeto Matmídia-Educa­
ção começou em 1995 com o apoio do programa REENGE (Reestruturação do Ensi­
no de Engenharia), do Centro Técnico Científico (CTC) da PUC-Rio, financiado pela
Finep, CNPq e Capes, que durou até 1997. Este projeto continuou até 1999, através
do programa REENGE Mão na Massa, que colocou em prática os resultados da fase
anterior. Contamos, também, com bolsas de iniciação científica da Faperj e do CNPq/
Pibic. Além destes programas, o projeto contou, durante toda a sua duração, com
recursos próprios e da universidade.

O enfoque do Projeto Matmídia-Educação


0 ensino de matemática tem sido feito, há séculos, através da relação direta entre
aluno e professor e, de tempos em tempos, são feitas reformulações sistemáticas que
procuram adequá-lo às mudanças ocasionadas pelos avanços teóricos e aplicados. O
uso integrado de matemática e multimídia é recente e vem sendo apontado, atualmen­
te, como capaz de proporcionar melhorias significativas no processo ensino/aprendi-
zado de matemática para os cursos básicos da universidade.
Hoje em dia já estão disponíveis softwares sofisticados que possibilitam explorar
vários aspectos do ensino de matemática com o auxílio do computador deixando,
entretanto, ao professor a tarefa de programá-los para que eles proporcionem o efeito
desejado. No Projeto Matmídia-Educação foram criados módulos associados aos tó­
picos das ementas de cálculo que são comuns à maioria das universidades brasileiras.
Estes módulos são chamados de softwares baseados em conteúdos e foram
implementados em C-H- com uso da biblioteca gráfica OpenGL em ambiente Windows.
Os softwares foram construídos integrando os conteúdos dos cursos de cálculo com o
auxílio de técnicas de computação gráfica, modelagem geométrica e cálculo numéri­
co. Isto abre a perspectiva de uso tanto dos livros quanto dos softwares por todo o
espectro de ensino básico de cálculo nas universidades brasileiras.
No núcleo do projeto está o fato de que se deve focalizar o uso de novas tecnologias
no entendimento de conceitos, deixando a programação para uma etapa posterior ao
ciclo básico. Acreditamos que os aspectos essenciais de um ambiente físico de ensi-

‘ Os autores e editores não se responsabilizam pelo uso inadequado dos softwares da coleção
Matmídia.
^Maiores informações no site http://www.matmidia.mat.puc-rio.br
no/aprendizado de matemática sejam a combinação harmoniosa de atendimento per­
sonalizado ao aluno, aulas convencionais, aulas em laboratórios de computação e
projetos em grupo.

Agradecimentos
Ao Magnífico Reitor da PUC-Rio, Padre Jesus Hortal Sánchez, S. J., pelo apoio ao
projeto em todas as suas etapas.
Ao Prof. Luiz Carlos Scavarda do Carmo, ex-Decano do Centro Técnico e Cientí­
fico (CTC) da PUC-Rio e coordenador do Projeto REENGE, que acreditou que o
projeto era importante para o CTC, dando-lhe apoio irrestrito.
Ao Prof. José Alberto dos Reis Parise, atual Decano do CTC e coordenador do
projeto REENGE Mão na Massa, que deu o apoio necessário para que pudéssemos
testar os softwares em sala de aula.
Aos Professores Paul Alexander Schweitzer e Carlos Frederico Borges Palmeira,
ex-diretores do Departamento de Matemática, que proporcionaram todas as condi­
ções necessárias para que o projeto tivesse sucesso.
Ao Professor Fernando de Almeida Sá, coordenador da Editora PUC-Rio, que
aceitou com entusiasmo a idéia de editarmos estes livros envolvendo-se em todas as
etapas do processo necessário à edição.
Ao Professor Luis Gustavo Nonato, do Instituto de Ciências Matemáticas e de
Computação da Universidade de São Paulo em São Carlos, pela sua inestimável cola­
boração, tanto no livro de Cálculo Integral a Várias Variáveis quanto no software
correspondente.
Aos Alunos de iniciação científica Cristiane Azevedo Ferreira, que implementou
o software relativo ao Cálculo a Uma Variável, e a Frederico Rodrigues Abraham e
Reinaldo Xavier de Mello que implementaram o software relativo ao Cálculo Inte­
gral a Várias Variáveis. O trabalho incansável e a devoção de vocês foram essenciais
para a realização do projeto.
Aos Professores do Departamento de Matemática que nos ajudaram a testar notas
de aula em todas as fases de desenvolvimento do projeto.
Vários alunos de iniciação científica fizeram ao longo dos anos versões prelimina­
res dos softwares desenvolvidos no projeto Matmídia-Educação. Além de excelentes
alunos eles tiveram uma imensa dedicação ao projeto. Cristiano Braz Rocha, Sérgio
Alvares Maffra, Danilo Tuler, Erick Ferreira, Alexandre Belloni dos Santos Noguei­
ra, Thiago Rennó Osório, Fábio Cavalcante Barroso, Igor Cruz Pinto Corrêa, Luiz
Henrique Raja Gabaglia Mitchell, Marcelo Gomes de Souza, agradecemos a vocês o
enorme entusiasmo com que participaram no projeto Matmídia-Educação.

Geovan Tavares
Coordenador do Laboratório Matmídia
Para a Léia.
Sumário

P r e fá c io 15

1 P o r q u e e stu d a r C álcu lo II? 23


1.1 Introdução........................................................................................... 23
1.2 E x e r c íc io s ........................................................................................... 34
1.3 Nota h istó r ica .................................................................................... 37
1.4 Leitura suplementar 37

2 O e sp a ç o e u c lid ia n o R" 39

2.1 Pontos e vetores no espaçoeu clid ia n o .......................................... 39


2.2 V etores.................................................................................................. 42
2.3 A álgebra de v e t o r e s ....................................................................... 45
2.4 Comprimento, norma e produto interno em R” ......................... 49

2.5 R e ta s ..................................................................................................... 63
2.6 P l a n o s .................................................................................................. 66
2.7 E x e r c íc io s ........................................................................................... 71

3 F u n ções esca la res co m várias variáveis 79


3.1 Lembrando Cálculo I ....................................................................... 79
3.2 Punções de duas variáveis 81
3.3 Curvas de n í v e l ................................................................................. 97
3.4 Punções de três variáveis esuperfícies de n í v e l ......................... 100
10 Sumário

3.5 Funções de n variáveis e hiperfícies de n í v e l ........................... 103

3.6 E x e r c íc io s ........................................................................................... 104

4 C o n tin u id a d e , n o çõ es d e to p o lo g ia e o teo r e m a d e W eiers-


treiss 121

4.1 Por que funções contínuas são importantes? 121

4.2 Continuidade em várias variáveis 123

4.3 O teorema de Wéierstrass no caso de n variáveis.................... 129

4.4 E x e r c íc io s ................................................................... 151

5 D eriv a d a s p arciais 163

5.1 Lembrando Cálculo I ....................................................................... 163

5.2 Definições e exem p los....................................................................... 164

5.3 Derivadas parciais de ordem s u p e r io r ......................................... 174


5.4 O teorema de Y o u n g ....................................................................... 176

5.5 E x e r c íc io s ........................................................................................... 177

5.6 Nota h istó r ic a ................................................................ 186

6 C u rvas p a ra m etriza d a s, tra n sfo rm a çõ es lin eares e o u tra s fu n çõ es


v e to r ia is 187

6.1 Curvas param etrizadas....................... 187

6.2 O vetor tangente a uma curva param etrizada........................... 197

6.3 Punções de R” para R’” 200

6.4 Transformações lineares 202

6.5 E x e r c íc io s ........................................................................................... 208

6.6 Leitura suplementar ....................................................................... 238

7 A p ro x im a çã o lin ear e a regra d a cad eia 239

7.1 Lembrando Cálculo I: a equação da reta t a n g e n t e ................ 239


Sumário 11

7.2 Aproximação linear em Cálculo I I ............................................... 242

7.3 Composição de fu n ç õ e s.................................................................... 263

7.4 Lembrando Cálculo I: a regra da c a d e ia ..................................... 266

7.5 A regra da cadeia em Cálculo I I ................................................... 266

7.6 E x e r c íc io s .......................................................................... 279

8 D eriv a d a s d irecio n a is e o v e to r g ra d ien te 291

8.1 Derivadas d irecio n a is....................................................................... 291

8.2 O vetor g r a d ie n te .............................................................................. 298

8.3 E x e r c íc io s ........................................................................................... 304

8.4 Nota h istó r ica .................................................................................... 311

9 O te o r e m a da fun ção im p lícita 313

9.1 O teorema da função implícita para ..................................... 313

9.2 O teorema da função implícita para R ^ ..................................... 326

9.3 Conjuntos de nível e hiperplanos ta n g e n te s.............................. 329

9.4 O caso geral do teorema da função im plícita*........................... 338

9.5 E x e r c íc io s ........................................................................................... 344

9.6 Leitura suplementar 349

10 M á x im o s e m ín im o s d e fu n ções de várias variáveis 351

10.1 Definições e exem p los....................................................................... 351

10.2 E x e r c íc io s ........................................................................................... 357

11 O tim iza çã o sem restriçõ es 365

11.1 Pontos críticos e a regra de F e r m a t ............................................ 365

11.2 Polinómios de T a y lo r ....................................................................... 371

11.3 Formas quadráticas e matrizes definidas .................................. 383


12 Sumário

11.4 Menores de uma m atriz............................................................. 395


11.5 Questões de globalidade e convexidade.................................. 405
11.6 O método dos mínimos quadrados........................................... 420
11.7 E xercícios................................................................................... 426
11.8 Leitura suplementar 454

12 O tim iza çã o co m restriçõ es 457


12.1 Otimização com uma restrição em ig u ald ad e......................... 459
12.2 Otimização com várias restrições em igualdade..................... 473
12.3 Otimização com uma restrição em desig u ald ad e.................. 485
12.4 Otimização com várias restrições em desigualdade............... 495
12.5 Otimização com restrições m i s t a s ........................................... 506
12.6 Alternativas para a condição de regularidade......................... 512
12.7 Problemas de m inim ização....................................................... 514
12.8 Condições de segunda ordem* 515
12.9 Questões de globalidade 520
12.10Exercícios................................................................................... 521

A F erram en ta com p u ta cio n a l: M u P A D 539


A.l Introdução................................................................................... 539
A.2 Iniciando o program a................................................................ 540
A.3 Operações aritméticas 542
A.4 Variáveis, atribuições e funções 543
A.5 Símbolos e funções matemáticas predefinidas......................... 546
A. 6 Manipulando expressões algébricas 547
A.7 Visualizando gráficos e curvas de nível 548
A.8 Calculando derivadas p a r c ia is ................................................. 551
A.9 Visualizando curvas e superfícies param etrizadas.................. 553
Sumário 13

A. 10 Calculando gradientes, jacobianas eh e s s ia n e is ......................... 555

B F erram en ta co m p u ta cio n a l: M a p le V 559


B . l Introdução.......................................................................................... 559
B.2 Iniciando o p rogram a...................................................................... 560
B.3 Operações a r it m é t ic a s .................................................................. 562
B.4 Variáveis, atribuições e funções . .............................................. 563
B.5 Símbolos e funções matemáticas predefinidas.......................... 566
B.6 Manipulando expressões algébricas ........................................... 566
B.7 Visualizando gráficos, curvas e superfícies de n í v e l ................ 568
B.8 Calculando derivadas p a r c ia is ..................................................... 572
B.9 Visualizando curvas e superfícies param etrizadas................... 574
B.IO Calculando gradientes, jacobianas e h e s s ia n a s ...................... 576

C R esp osteis d e alg u n s ex ercício s 579

N o ta ç õ e s e c o n v e n ç õ e s 605

B ib lio g ra fia 607

ín d ic e 615
Prefácio

A p resen ta çã o : C álcu lo D iferen cia l e O tim iza çã o

Este livro nasceu das notas de aula do curso de Cálculo Diferencial de


Funções de Várias Variáveis para os alunos de Economia, Engenharia, Física,
Química e Matemática, da PUC-Rio. A proposta é o de apresentar os concei­
tos e técnicas de Cálculo Diferencial, usando problemas de otimização como
um forte elemento motivador. Esta diretiva é empregada em todo o livro.
Nossa experiência, ao longo de quase cinco anos, tem mostrado um resultado
muito positivo com este tipo de procedimento.
Logo no primeiro exemplo do primeiro capítulo (o problema da caixa),
o aluno recorda como a derivada é uma ferramenta extremamente poderosa
para resolver um problema de otimização, no caso, um problema de oti­
mização unidimensional Nos dois exemplos seguintes, o aluno é desafiado a
tentar resolver dois problemas de otimização multidimensionais: o problema
da dieta e o problema do planejamento hidrotérmico. O aluno convence-se,
então, da dificuldade de resolver tais problemas e da necessidade de ferra­
mentas matemáticas adequadas para fazê-lo.
Mas mais do que uma finalidade, a linguagem de otimização é extrema­
mente adequada para introduzir alguns dos objetos fundamentais de Cálculo
Diferencial a Várias Variáveis: as derivadas parciais, as derivadas direcionais
e o vetor gradiente. Em geral, ao motivar estes conceitos pela primeira vez
no livro, deu-se preferência a um contexto econômico (lucro, custo), no lugar
de um contexto físico (posição, velocidade). Nossa experiência mostra que
os alunos sentem-se mais confortáveis num contexto econômico (o artigo [24]
apresenta um exemplo muito interessante que ilustra este ponto de vista).
Naturalmente, as aplicações em Física não foram esquecidas e estão presentes
no livro.
O texto é escrito em estilo coloquial e, apesar de quase 600 páginas, é
16 Prefácio

muito fácil de se ler. Um cuidado especial foi tomado com a elaboração das
mais de 250 figuras que aparecem no texto.
Existem algumas diferenças no texto, com relação ao enfoque que se dá
tradicionalmente nos livros de Cálculo Diferencial a Várias Variáveis, que
gostaríamos de comentar.

1. A linguagem matricial é amplamente usada no texto. Afinal, um dos


resultados fundamentais na teoria de Cálculo Diferencial é que, sob cer­
tas condições, uma função ‘‘complicada” pode ser aproximada por uma
função muito mais simples na vizinhança de um ponto, a saber, uma trans­
formação linear. Mais ainda: a partir do estudo das propriedades desta
transformação linear (algo supostamente mais fácil de fazer), consegue-
se estabelecer propriedades (locais) de interesse da função original. O
método de Newton é um exemplo formidável desta idéia. Outro benefício:
com o uso de matrizes, a regra da cadeia fica mais fácil de se entendida e
aplicada. Caso necessário, o aluno consegue deduzir facilmente qualquer
“regra da cadeia em termos das funções coordenadais”, a partir da versão
matricial. Um curso de Álgebra Linear, embora recomendado, não é pré-
requisito para o uso deste livro. As noções básicas de Álgebra Linear são
introduzidas no texto, incluindo a definição de transformação linear e sua
representação matricial.

2. A classificação local de pontos críticos é feita para o caso geral^ e não


somente para funções que dependam de duas ou três variáveis. No texto,
apresentamos três métodos que permitem classificar a positividade da
matriz hessiana da função em um ponto crítico: o método de Lagrange
(completamento de quadrados), menores principais e autovalores.

3. Teoremcis que garantem a globalidade de um ponto crítico são apresenta­


dos. Para isto, introduzimos as definições e propriedades básicas de con­
juntos convexos, funções côncavas e convexas. Em particular, apresenta­
mos dois exemplos interessantes que mostram como certos resultados que
são verdadeiros no caso unidimensional, tornam-se falsos quando adapta­
dos para o caso multidimensional (veja o exercício [19] na página 363 e o
exercício resolvido (11.4) na página 405).

4. O teorema dos multiplicadores de Lagrange é estudado no caso geral, isto


é, com um número arbitrário de restrições em igualdade.
Prefácio 17

5. No caso do conjunto admissível ser construído com restrições em desigual­


dade (ou mesmo com restrições mistas), o que se sugere é procurar por
candidatos no interior do conjunto admissível (pontos críticos da função-
objetivo) e, em seguida, com o teorema dos multiplicadores de Lagrange,
procurar por candidatos na fronteira do conjunto admissível, analisando
os vários casos possíveis (isto é, candidatos em faces, arestas ou vértices).
No livro, apresentamos um resultado que unifica este tratamento: o teo­
rema de Karush-Kuhn-Tucker. Publicado em 1950, este teorema iniciou
a teoria moderna de otimização não-linear. Tanto em aspectos teóricos
quanto computacionais, o teorema possui várias aplicações em Economia,
Engenharia e Matemática

S ob re a org a n iza çã o do curso

O material deste livro pode ser perfeitamente coberto em um curso se­


mestral, com 4 horas por semana. O texto segue uma ordem canônica, mas
pode haver alterações, sem prejuízo para o curso. Por exemplo, o teorema
de Weierstrass, tratado no capítulo 4, pode ser visto antes do capítulo 12
(otimização com restrições). Outra prática é a de se apresentar uma versão
preliminar da regra da cadeia para o caso de composições de funções esca­
lares com curvas parametrizadas, seguir com o capítulo 8 sobre derivadas
direcionais e o vetor gradiente e, depois, voltar para o capítulo 7, para estu­
dar a versão geral da regra da cadeia. Boa parte do conteúdo do capítulo 2
pode ser omitida, pois o aluno já estudou vetores em um curso de Física no
Ensino Médio e, provavelmente, também já o fez em um curso preliminar de
Álgebra Linear no Ensino Superior. As seções com um asterisco (*) apre­
sentam assuntos avançados, e podem ser omitidas em uma primeira leitura.

S ob re os ex e rc ício s

Os exercícios são apresentados no final de cada capítulo e, embora não


haja uma indicação explícita, eles são divididos de acordo com cada seção. Os
exercícios são apresentados quase sempre em ordem crescente de dificuldade.
Um asterisco (*) indica explicitamente um exercício mais elaborado ou um
exercício com conteúdo opcional. No apêndice C, colocamos as respostas
de alguns exercícios. Mas, mais do que obter a resposta final, o aluno deve
ter consciência da importância de escrever uma justificativa coerente, que o
18 Prefácio

conduza à resposta. Isto é especialmente verdade para os exercícios do tipo


“verdadeiro ou falso”.
Não colocamos as respostas dos exercícios que pedem o cálculo explícito de
derivadas parciais, matrizes jacobianas e hessianas no apêndice C. O aluno
pode usar um sistema de computação simbólica para verificar suas respos­
tas. No apêndice A, descrevemos os comandos básicos do MuPAD Light
(um sistema de computação simbólico gratuito para professores e alunos)
que permitem fazer estas contas. No apêndice B, descrevemos os comandos
básicos análogos para o software Maple V.

A p o io c o m p u ta c io n a l

O endereço na internet para a página web do livro é:


http://www.mat.puc-rio.br/^h jbort ol/cdf vv/livro/

Nesta página, você encontrará uma coleção de links interessantes para um


curso de Cálculo Diferencial de Funções de Várias Variáveis, o que inclui
fatos históricos, as biografias dos vários matemáticos que desenvolveram os
teoremas que aparecem no texto, entrevistas, aplicações da teoria de oti­
mização, grupos de discussão, programas de computador e, naturalmente, a
errata do livro. O símbolo

nas margens direita ou esquerda de uma página, indica explicitamente a


existência de um link para o exemplo ou exercício resolvido em questão.
Em particular, um applet JAVA foi especialmente desenvolvido, com o obje­
tivo de permitir a visualização tridimensional de gráficos de funções de duas
variáveis e superfícies de nível de funções de três variáveis, que aparecem no
texto. Por exemplo, a figura (1) mostra o uso deste applet para visualizar o
gráfico da função do item (c) do exercício [24] do capítulo 3,

1 5 jV e - ^
2 = f{x,y) = + J/2

definida no quadrado [—2, +2] x [—2, +2]. Com o applet, ainda é possível
girar, encolher ou ampliar o desenho. O uso do applet é particularmente
Prefácio 19

tm» tiíHn ^ <.................... ......................... ^


'V ^ _____ _________ P«eti__ Atuafaar_Paynairfcat 'Ã fi9«qtto>.ty"M
<s{gngOs j^;0>àew^ ^fapènws;; |
“3
Exercício [24] (c) do capítulo 3
«■Wf 7----------------------------------------
t«m0sr^a<iogHif$c^

F ^ jJ " J íj
tIpoOepM:

' 'v=

Figura 1: A pplet JAVA para o exercício [24], item (c), do capítulo 3.

Útil nos capítulos iniciais, onde tentamos criar uma percepção geométrica
tridimensional. Para usar os applets, seu navegador deverá estar com a opção
‘‘JAVA” habilitada. Além dos exemplos disponíveis, você poderá adaptar
estes applets para visualizar suas próprias funçõesl Acesse a página web do
livro para obter instruções detalhadas de como fazê-lo.
Um outro recurso computacional interessante é o programa MuPAD, um
ambiente desenvolvido para cálculos matemáticos, sejam eles simbólicos,
numéricos ou gráficos. Com ele você poderá obter soluções exatas de mui­
tos problemas matemáticos, incluindo fatoração de números inteiros e po­
linómios, cálculo com matrizes, sistemas lineares e não-lineares de equações,
números complexos, trigonometria, limites, derivadas, integrais, equações di­
ferenciais, etc. O programa é desenvolvido por um grupo de pesquisadores
da Universidade de Paderborn, Alemanha. Sua distribuição é gratuita para
professores e alunos. Você poderá obter uma cópia do MuPAD no endereço
http://www.sciface.com/mupad_download/

através de um registro gratuito. Versões para outros sistemas operacio­


nais (Linux, Macintosh, Solaris) podem ser obtidas no mesmo endereço.
No apêndice (A), você encontrará um tutorial com os comandos básicos
20 Prefácio

do MuPAD, relevantes para um curso de Cálculo Diferencial de Funções de


Várias Variáveis.

P r o d u ç ã o gráfica do livro

Este livro foi produzido inteiramente em usando o ambiente


M iKT]^ de Christian Schenk. Parte do texto (cerca de 80%) foi digitada
usando o editor VIM, de Bram Moolenaar e a outra parte digitada com o
uso do editor WinEdt, de Aleksander Simonic.
Todas as figuras foram geradas por computador. A partir das equações, o
programa Maple V foi utilizado para produzir a figura em um arquivo Post­
Script para, então, ser convertido para o formato encapsulated postscript,
com os programas Ghostscript e GSview. Isto produzia um primeiro esboço.
Retoques finais (texto, setas, padrões de preenchimento, espessura das linhas,
etc.) foram efetuados com o programa Adobe Illustrator, para produzir a
versão final da figura.

A figura d a cap a

A definição do formato da Terra não envolve a descrição de montanhas e


vales mas, sim, o formato da superfície do nível do mar e sua continuação
hipotética sobre as porções de terra, eliminando-se os efeitos das ondas,
ventos, correntes e marés. Esta superfície é denominada geóide.
Pode-se mostrar que o geóide é uma superfície de nível do potencial gerado
pelo campo gravitacional da Terra. Sendo assim, em cada ponto do geóide,
a linha de prumo é sempre perpendicular ao geóide. Esta propriedade faz
do geóide uma referência natural para medir alturas.
Por causa das distribuições irregulares de massa na Terra e de anomalias
gravitacionais, a descrição matemática do geóide não é muito simples e, por
este motivo, formas geométricas mais elementares foram sugeridas para se
aproximar o geóide, como a esfera e o elipsóide de revolução.
A figura da capa, produzida pelo programa de computador GMT (veja a
referência [79]), mostra a projeção de Hammer das curvas de nível da altura
do geóide com relação a um elipsóide de referência. Níveis positivos são
desenhados com uma linha sólida e níveis negativos com uma linha tracejada.
Prefácio 21

A g r a d e c im e n to s

Antes de tudo, gostaria de agradecer a Geovan Tavares dos Santos, coor­


denador do projeto MatMídia. Sem seu empenho, dedicação, entusiasmo e
pioneirismo, este livro não teria sido publicado.
Gostaria de agradecer também às várias pessoas que colaboraram com su­
gestões e correções durante o processo de elaboração deste livro. Entre elas:
Ana Tereza Figuereido Vasconcellos, Márcio Henrique Gonçalves Pinto, Ma-
riana Martins, Constanza Gortes, Filipe Colaço, Bernardo Schneider, Rapha-
ela Pimentel de Azevedo Athayde, Glenda Bezerra Lustosa, Roberta Levy
Martins, Daniel Chrity, Mário Maia Nevares,

Eduardo Marques, Vanessa
Baldi, Carolina Damazio, Luis Eduardo Avila de Souza, José Américo Ro­
drigues Araújo Filho, Rafael Ruggiero Rodriguez e Sérgio Bernardo Volchan.
Em especial, gostaria de agradecer a Francisco Satuf Rezende, Luciana Ar­
ruda, Moema Ribeiro da Silva e Ricardo Soares Leite, pela leitura e crítica
minuciosas do texto.
Finalmente, gostaria de agradecer a Marco Antônio Grivet Mattoso Maia
e Walter H. F. Smith, por permitirem a reprodução dos mapas da capa e
das figuras (8.5) e (10.4); e a Konrad Polthier e Letícia Gentile Veiga, pela
ajuda na programação dos applets JAVA disponíveis na página web do livro.

Rio de Janeiro, 7 de janeiro de 2002

Humberto José Bortolossi


hjbortol@mat.puc-rio.br
Capítulo 1

Por que estudar Cálculo II?

1.1 Introdução

Matemática é uma ferramenta ideal para se resolver problemas práticos.


Ela fornece uma linguagem apropriada para modelá-los e também desenvolve
técnicas para resolvê-los. Vamos ver como isto funciona com o problema
abaixo.

P ro b le m a 1.1 Você foi contratado por uma empresa que fabrica cai­
xas sem tampa. Cada caixa é construída a partir de um folha retangu-
|||||||j||||||||j||||||||||||^ ^
quadrado de lado medindo a: cm é retirado de cada canto da folha de
|||J |||||||||||; Í i Í j ||S
|||j j Í |Í ||||||||Í i l |||||||Í : ; Í ||i |^
|||Í ||||||||i Í ||j |||||||J ^
||||||l|i||||||^ ^

Como você abordaria este problema? Evidentemente, você poderia ten­


tar construir várias caixas, para diferentes valores de x, calcular o volume
correspondente e ficar com a de maior volume. Por outro lado, quantas ten­
tativas você faria? Isto seria suficiente para obter a resposta do problema?
Isto seria suficiente para obter uma aproximação da resposta do problema?
Com que erro? E, se a cada semana, a empresa utilizasse folhas de papelão
de tamanhos diferentes para fabricar caixas novas?
Vamos mostrar (relembrar) como funções e Cálculo I nos ajudam a resol­
ver este problema.
24 Por que estudar Cálculo II?

30 cm

50 cm

Figura 1.1: Construindo um a caixa sem tam pa a p artir de um a folha de papelão.

P asso 1. Devemos descrever uma variável de controle sob a qual o pro­


blema será formulado. Neste caso, a escolha parece ser simples:
a variável x que representa a medida do lado do quadrado retirado
de cada canto da folha de papelão.
P asso 2 . Devemos agora obter uma função-objetivo que descreva o volume
da caixa (que estamos interessados em maximizar) de acordo com
0 tamanho x do lado do quadrado retirado de cada canto da fo­
lha de papelão. Esta função pode ser obtida lembrando-se que
o volume de uma caixa é dado pelo produto da medida de suas
dimensões. Em nosso caso, as medidas são 30 —2-x, 50 —2 - x e
X. Logo, a função que modela o problema é dada por

V(x) = (30 —2x) • (50 —2x) • x.


P asso 3. Quais valores x pode assumir? Existem restrições para a variá­
vel X? Se você olhar para a fórmula acima verá que, em princípio,
podemos calcular V(x) para qualquer x real (por exemplo, x = 5,
X = —1.2732, X = 1 + V^, etc.). Mas, por razões de modela­
gem, não vamos admitir valores negativos de x. Também, não
faz sentido retirar um quadrado com mais do que 15 cm de lado
(lembre-se que o papelão tem dimensão 30 cm x 50 cm). Assim,
os valores admissíveis para x constituem o intervalo [0,15]. Re­
sumindo, queremos determinar x de forma que o valor V[x) seja
1.1 Introdução 25

O maior possível, isto é, queremos resolver o seguinte problema de


otimização:

maximizar V{x) = (30 - 2x) ■(50 - 2 x ) - x


sujeito às restrições: X > 0 e X < 15.

Observação: você pode considerar x = 0 e x = 15 casos degene­


rados onde a ‘^caixa’’ formada tem volume zero.
P asso 4. Finalmente, devemos resolver o problema utilizando alguma técni­
ca. Você viu em Cálculo I que todo extremo local de uma função
derivável que pertence ao interior do domínio da função é um
ponto crítico (um ponto que anula a derivada da função). Pon­
tos críticos constituem candidatos naturais a extremos globais.
Mais ainda, para uma função derivável definida em um intervalo
fechado e limitado (o caso de nosso problema), os candidatos a
extremos globais são justamente os pontos críticos e os extremos
do intervalo.
Com isto em mente, vamos encontrar os pontos críticos da função
V{x) = (30 —2x) • (50 —2x) • x. Como

V \ x ) = 12x^ - 320x + 1500,

vem que as soluções da equação V \ x ) = 0 são dadas por

4 0 - 5 \/ Í 9 40 + 5 \/l9
Xi = X2 =
3 " 3
O ponto X2 deve ser desconsiderado porque X2 > 15, isto é, ele
está fora do intervalo [0,15]. Assim, o único ponto crítico de V
no intervalo [0,15] é o ponto xi (o número x = 6.0685 é uma
aproximação de xi com erro menor do que 0.001). Como o valor
da função V nas extremidades do intervalo [0,15] é zero, segue-se
que xi = (40 —5a/ I 9)/3 é o ponto de máximo de V em [0,15] e o
valor máximo é V{x{) = (28000 + 19000\/l9) /27 = 4104.41....

Este exemplo, apesar de simples, ilustra bem a idéia básica de como


um engenheiro, economista, físico, biólogo ou matemático aplicado traba­
lha. Você, como cientista, está interessado em estudar e entender algum
fenômeno específico em sua área (o peso que uma viga pode suportar ou
26 Por que estudar Cálculo II?

O índice da bolsa de valores ou o crescimento de uma população de uma

espécie nociva de bactérias ou a aerodinâmica de um novo protótipo de asa


de avião). A primeira coisa a se fazer é modelar o problema, isto é, escolher
variáveis e fórmulas adequadas para representá-lo matematicamente (você
fará matérias específicas que ensinarão porque determinadas equações são
escolhidas para representar certos fenômenos, as simplificações e restrições
envolvidas, etc). Uma vez que o problema é modelado, o passo seguinte é
aplicar a matemática para deduzir resultados. Bem, onde Cálculo II entra
nesta história? Justamente no segundo passo. Cálculo Diferencial é uma
ferramenta ótima para se estudar crescimento, decrescimento e extremos de
uma função. Em Cálculo I estes tópicos são tratados para o caso de funções
que dependem de apenas uma única variável O que faremos aqui é estabe­
lecer resultados para o caso de funções que dependem de várias variáveis.

P ro b le m a 1.2 ( da dieta ) Uma empresa que fornece refeições a


seus funcionários contratou um nutricionista, a fim de estabelecer um
cardápio que atenda a quantidade diária mínima de vitaminas que um
funcionário deve consumir e minimize o custo de compra dos diversos
tipos de alimentos. O nutricionista dispõe de uma tabela que especifica
a quantidade mínima de cada tipo. de vitamina que deve ser ingerida
diariamente por cada funcionário
Tipo de vttamina^ ■ liil Ü E
Quantidade mínima (mg) 1 1 1 .1 60 : 11
Ele também dispõe de uma tabela com a quantidade (em mg) de vita­
minas em cada 100 gramas de 9 tipos de alimentos diferentes,
■M B ilii c E.
Alimento 1 0 140 0.08 0 160
Alimento 2 ■ iiiii » !■ 0 0.00
Alimento 3 ■ ■ iii É i i 26" 6 90
Alimento ^ ■ 0 i i i 38 0.20
Alimento 5' 26.780 j Í | É 13 0.07
Alimento 6 0 035 l i i l 1 OOÒ
AUmento 7- ilB 5 0.02
Ahmento 8 iB iiiiii 8 0.10
Alimento 9 iiig iÜ 2Ò0
1.1 Introdução 27

: de uma tabela com o preço de 100 gramas de cada tipo de alimento:


Alimento 1 8
Preço 0.60 1.00 5.00 1.00 0.50 0.20 0.15 0.40 1.00
O problema é determinar o quanto comprar de cada tipo de alimento, a
fim de que a empresa forneça a seus funcionários uma alimentação que
siga a recomendação diária de vitaminas, gastando o menos possível.

Como você abordaria este problema? Você poderia, como no problema an­
terior, tentar algumas combinações de consumo de alimentos e calcular os
custos correspondentes. Mas quantas combinações seriam necessárias para
obter ‘‘boas’’ aproximações da solução do problema? Observe que nem toda
combinação de consumo de alimentos é válida, pois é preciso atender o con­
sumo mínimo diário de cada tipo de vitamina. Para resolver o problema,
vamos seguir os mesmos passos utilizados na solução do problema (1.1).

P asso 1. Precisamos escolher uma variável de controle ou, melhor dizendo,


precisamos escolher várias variáveis de controle pois, ao contrário
do problema (1.1), não é possível descrever matematicamente o
problema da dieta com apenas uma única variável. A escolha
parece ser simples: a variável x\ representa a quantidade (em
“pacotes” de 100 g) do alimento 1 que a empresa deve comprar di­
ariamente para cada funcionário, a variável X2 representa a quan­
tidade (em “pacotes” de 100 g) do alimento 2 que a empresa deve
comprar diariamente para cada funcionário, e assim por diante.
Resumindo, xi representa a quantidade (em “pacotes” de 100 g)
do alimento i que a empresa deve comprar diariamente para cada
funcionário, com í = 1, . . . , 9.
P asso 2 . Devemos agora obter uma função-objetivo que descreva o custo
(que queremos minimizar) associado à compra dos diversos tipos
de alimentos para cada funcionário. Cada “pacote” de 100 g do
alimento 1 custa R$ 0.60 então, na compra de x\ “pacotes” , tere­
mos de pagar 0.60 • x\ reais. Prosseguindo com este raciocínio, é
fácil perceber que o custo total associado à compra de X2 ‘^paco­
tes” do alimento 2 será 1.00 • X2, que o custo total por funcionário
referente à compra de X3 “pacotes” do alimento 3 será 5.00 • 0:3,
28 Por que estudar Cálculo II?

etc. Sendo assim, o custo total por funcionário será a soma dos
custos parciais correspondentes à compra dos nove tipos diferentes
de alimentos:
C{xij X2, ^3, 0^4, X5, Xq, Xy, Xs, Xg) = 0.60 • Xi + 1.00 • X2 +
5.00 • X3 + 1.00 • X4 +
0.50 • X5 + 0.20 • xq +
0.15 • X7 + 0.40 • xg +
1.00 • Xg.
Criamos então uma função de nove variáveis que a cada ponto
(xi) X25 X3) X4j X5, Xg, Xy, Xgj 2:g)
associa o número real
CJ C^^X^j X^^ ^ 3j ^4) ^5) ^ 7j ^8j ^9)
definido pela expressão acima.
P asso 3. Apesar da fórmula para o custo fazer sentido para quaisquer es­
colhas dos valores de xi, X2, X3, X4, X5, xg, X7 , xg e xg, muitas
delas não devem ser consideradas porque elas não estariam de
acordo com a recomendação de consumo mínimo de vitaminas.
Por exemplo, caso a empresa resolvesse não comprar alimento al­
gum, teríamos 0 custo C(0, 0, 0, 0, 0, 0, 0, 0, 0) = 0, mas certamente
ela não estaria atendendo o consumo mínimo de vitaminas.
Quais são as restrições então? As restrições vêm da imposição do
consumo mínimo dos diversos tipos de vitaminas. Por exemplo,
cada funcionário deve consumir pelo menos 3 mg de vitamina A.
Como cada 100 g do alimento 1 possui 0.140 mg dessa vitamina,
a compra de xi “pacotes” do alimento 1 corresponderá a um con­
sumo diário de 0.140 • xi mg da vitamina. Por outro lado, o
alimento 4 não possui vitamina A, de modo que a compra de qual­
quer quantidade deste tipo de alimento não contribuirá para o con­
sumo. Assim, se considerarmos a contribuição dos nove tipos dife­
rentes de alimentos, teremos um consumo diário (em mg) de vita­
mina A igual a 0.140-xi+0.580-X2+0.150-X3+26.790-X5+0.035-xg.
Como o consumo mínimo de vitamina A é 3 mg, obtemos nossa
primeira restrição:
0.140 • Xi -f”0.580 *X2 0.150 • X3 H- 26.790 • xg + 0.035 • xg ^ 3.
1.1 Introdução 29

Analogamente, o consumo mínimo das vitaminas B, C e E também


produz restrições:

0.08 • Xi -h 1.30 • “b 0.08 • X4 H- 0.07 • x^-\-


0.05 • xq -j" 0.04 • Xj H“ 0.08 • x^ -f- 0.07 • xg ^ l*!?
26 • X3 + 38 • X4 + 13 • X5 + xq+
5 • 2:7 + 8 ♦Xg + 25 • Xg > 60,
1.60 • xi + 6.90 • X3 + 0.20 • X4 + 0.07 • X5+
0.02 • X7 + 0.10 •X8 + 2.00-Xg > 11.

Temos também que as variáveis Xj, i = 1, . . . , 9, devem ser to­


das maiores ou iguais a zero (pois não faz sentido comprar uma
quantidade negativa de alimentos). Resumindo, a empresa deve
resolver o seguinte problema de otimização:

Minimizar

^2) ^3) ^65 ^7) ^8) ^9) 0 .6 0 '- Xi + 1 .0 0 '■X2+


5 .0 0 ' ’ 2:3 + 1 .0 0 ' • 3:4+
0 .5 0 ' ■2:5 + 0 .2 0 '■X q-{-
0 .1 5 ' • 2:7 + 0 .4 0 ' • X s+
1 .0 0 '• Xg
sujeito às restrições

26.790 • X5 + 0.035 • 2:6 > 3,


0.08 • X\ -f- 1.30 • X3 + 0.08 • 2^4 + 0.07 • X5+
0.05- 2^6 +• 0.04 • X7 + 0.08 • Xg + 0.07 • Xg > 1.1,
26 • X3 + 38 ■X 4 + 13 •X 5 + X q+
5 • X7 + 8 • Xg + 25 • 2;g > 60,
1.60 • X\ “h 6.90- X3 -|- 0.20 • X4 -\- 0.07 • X5+
0.02 • X7 + 0.10 • Xg + 2.00 • 2;g > 11,

Xi > 0, X2 > 0 , X3 > 0, X4 > 0,


X5 ^ 0, X0 > 0 , X7 > 0, Xg > 0 e Xg > 0.

P asso 4. Finalmente, devemos resolver 0 problema utilizando alguma téc­


nica e é justamente aqui que Cálculo II vem em auxílio. O que
30 Por que estudar Cálculo II?

faremos neste curso é desenvolver uma teoria e técnicas que per­


mitam entender e resolver (de maneira eficiente) problemas como
este. Se você está curioso para saber qual a solução deste pro­
blema, aqui está a resposta:
502822955
xi = = 6.245...,
80508852
X2 = 0,
4535345
= = 0.112...,
40254426
X^ ~~ 0,
1584865
Xs = = 0.078...,
20127213
Xe = 0 ,
75204670
X7 = = 11.209...,
6709071
XS = 0,
Xg = 0.

O bservação. O problema acima possui uma particularidade muito interes­


sante: tanto a função-objetivo quanto as restrições são lineares^ isto é, do
tipo ‘‘constante vezes variável mais constante vezes variável mais constante
vezes variável, etc’’. Existe toda uma teoria específica para o estudo da
solução de tais problemas e ela constitui uma área da matemática denomi­
nada programação linear. Evidentemente, toda teoria que vamos desenvolver
aqui em Cálculo II se aplica a problemas de programação linear mas, devido
à linearidade, algoritmos mais eficientes para a solução do problema podem
ser formulados. Não vamos tratá-los aqui. Eles são estudados em um curso
de pesquisa operacional
Vamos ver agora um exemplo de um problema de programação não-linear^
isto é, de um problema de otimização onde a função-objetivo ou algumas
restrições não são lineares. A formulação do problema do planejamento
hidrotérmico, dada a seguir, é ligeiramente mais complicada do que as for­
mulações dos problemas anteriores e, por este motivo, não vamos seguir
o mesmo esquema de desenvolvimento, feito em quatro passos. No lugar,
vamos estabelecer a função-objetivo e as restrições à medida em que descre­
vemos o problema.
1.1 Introdução 31

p r o b le m a 1.3 ( do planejamento hidrotermiGo ) A energia elé­


trica que você consome pode ser produzida tipicamente em dois tipos
de usinas: hidroelétricas e térmicas. A vantagem no emprego das
usinas hidroelétricas é que elas não gastam combustível algum para
operar, usando apenas a água dos seus reservatórios que vem das chu­
vas. O custo de operação das usinas hidroelétricas é zero As usinas
| |iM iÍB § ^ i|||||Í||§ ||Í|||B tsijH jfci|(|W |S § lS M
B ÍÍÍiS ÍilÍ|ÍÍÍÍÍ||l iÍiM ffiÍiiB ittiB iíãliiS|lhM itÍMl^

|Í ||Í p Í ÍiÍ i p l ã |l Í Í 8 S |rBÍilÍÍiÍSÍÍrâíBiÍliÍÍl i§IB


|lí|jig |j||||B tfllH iÍͧ l l |ÍÍÍilii§BI8iWfflÍiil b i iiiÍ iu iii^
ÍÍ8§iiiÍÍllslH ͧÍisíÍÍS lmljó i!ilÍíiÍÍÍBãBi§Í8ãoÍIÍi B§§liSl^^

ÍiͧÍgÍÍlÍÍÉ i iffliMÍfciÍ i|illH ÍlÍllÍrtB ͧ iÍ|B iiã H ÍÍÍiiÍiB ilÍiB I8 ^

iliB iB iB B iÍiíp Í Í iiiÍ g Í i lW |||B ͧ |i|li||m ft


IÉIlp!ilÍlim^giWWiÉiiiiliÍieB!.lteÍÍimÍM ilig M ÍIÉ ÍM ^
droelétricas e térmicas em um determinado período de tempo, que será
representado pelo intervalo [0, T], a fim de que o custo de operação seja
iÍÍBm iiKÍlttiW §qiÍÍÍlêlB im iiÍ-iiiiiW §lliÍli!étB íiB i8l^
IB§Bâi idíip!HWi§iB li8IÍÕrmul S § |pibS§BSIBiii!SHÍí^^
iipt]m iifilBíãiritiilBÍiÍpÍBíbdliflilÍiBW ilp lil|ii HiiÍ l^
i||Íli§ êBãSBi§igh8ÍͧlpqlÍÍtáBó§WiÍiÍiiÍÍB^^^^

Wii II
m g É lii

tT/NS. ‘ Í2 T/N.S ! liiS iíiili im

;B fn rtêj|p B J||M lêh |íg ilj|f^iicál|iró d !iziiB i|^ ^


Ii88ÍÍiiláÍfÍÍÍIÍÉ ÍrtêiB eriêB ftÍ(i||ÍÍi|liiiÍiilfi(B
iB raB B Í|Í|pártiB idÍÍiÍB Bí8ráffiáiBiÍir^ÍÍiiiB i^^
I J g ||8 i |r t |l |i i |i Í |||i |: ||||||i |i S i ||f § i Í J
iflllié B iliig iid liiiilê líiililI liiliiii i l i l i i B i i i g
32 Por que estudar Cálculo II?

Denote por ht,i a energia elétrica produzida pela i-ésim a usina hi­
droelétrica no estágio t Com um pouco de Física, é possível demons­
trar que esta energia pode ser. calcu^da em termos do volume vt,i no
reservatório e da vazão de água turbinada .

' 9í,i»
onde Pi é um a função que depende do formato do reservatório. Para
reservatórios com grandes espelhos d ’água, pi{x) —r,-- v ^ , com r» uma
constante p ositiva..' ' !' ; I '

O quanto uma usina hidroelétrica pode turbinar, â quantidade de ener­


gia elétrica que ela pode produiiir e o volume dos reservatórios também
estão limitados: 0 < qt,i < 0 <, < h» e,i^ < < Vi, para
cada í = l ; . . . , N S e i = 1 , . , . , N H , com NM..0 námero de usinas
hidroelétricas do sistema.

As usinas térmicas e hidroelétricas devem suprir á demanda de energia


eih cada estágio de tem po t:
NH NT
£ ' com X , . ,’N S,

Existe uma equação que descreve o balanço de água de um mês para


1.1 Introdução 33

/ = Vt,i + bt,i • Ar ™qt,i ■Ar - St^i *Ar,


isto é, 0 volume no estágio 1 é igual ao volume Vt,i no estágio t
anterior mais a quantidade de água das chuvas bt,i *A r menos a quan­
tidade de água turbinada qt^i • A r menos a quantidade de água vertida
$t,i • A r , com $t,i > 0 e A r a quantidade de segundos em cada estágio.
O custo vem do emprego das usinas térmicas; !

com Cj uma constante positiva que representa o custo de geração


unitária. Resumindo, ò problema de planejamento hidrotérmico, con­
siste em resolver o segmnte problema de otimização:

Minimizar ■
NS NT
èè^^ríy -A r

sujeito às restrições
H lilIB B IIlllB B IH IB IIH H iilH H lllilllilH Illlll
= df,

ht,i — Pi{‘ut,i)' qt,i)


Vt+I = Vt,i + btà • Ar - qt^i - Ar - st,i • Ar,
0 < 9i j < 9j , 0 < çt,í < 9 i , V i < vt+i,i < Vi, 0 < s<,i,
para f = 1 , . . . , N S , í = 1 , . . . , N H e j = 1 , . . , , N S. Ás variáveis-
de controle são as gerações 9 tj, os turbinamentos qt,i e os verti-
mentos st,i. Os volumes iniciais vq,í dos reservatórios são forneci-
Í^^BiÍiillÍiilÍÍilÍiÍBÍllilBÍI l ÍBiligÍÍBÍipÍÍlÍll^

Observe que para um sistem a de 1 usina hidroelétrica, 8 usinas


térrmcas e 48 estágios de tempo, o que se deve resolver é um problema
de programação não-linear com 480 variáveis. Você pode observar a
não-linearidade na função-objetivo e na r e s t r i ç ã o = P í(vt,i) • qt,i-
34 Por que estudar Cálculo II?

Problemas de programação não-linear aparecem em muitos contextos (na


Economia, na Física, na Engenharia, etc). Contudo, eles são mais difíceis
de se resolver se comparados com os problemas de programação linear, para
os quais existem algoritmos gerais e eficientes: o método simplex ou, mais
recentemente, os métodos de ponto interior.
Não conseguiremos abordar todos os aspectos matemáticos e computa­
cionais necessários para se resolver, de maneira eficiente, problemas de oti­
mização como o da dieta e do planejamento hidrotérmico. Para isto, preci­
saríamos de muito mais tempo! Contudo, neste curso de Cálculo II, vamos
estabelecer uma porção substancial da teoria básica necessária para um curso
mais avançado de otimização.

1.2 Exercícios

Para lembrar um pouco da teoria de Cálculo I, resolva os exercícios abaixo,


dizendo se cada uma das sentenças é verdadeira ou falsa, apresentando uma
justificativa caso ela seja verdadeira ou um contra-exemplo caso ela seja falsa.

[01] Todo ponto crítico de uma função derivável / : M — R (isto é, todo


ponto que anula a derivada da função / ) é um extremo local de / .

[02] Toda função / : [a, 6] C R -> R definida em um intervalo fechado e


limitado possui pelo menos um extremo global em [a, 6].

[03] Toda função f : D C contínua possui pelo menos um extremo


global em D.

[04] Toda função contínua / : [a, 6] C R -> R definida em um intervalo


fechado e limitado possui pelo menos um ponto de mínimo global e pelo
menos um ponto de máximo global em [a, 6].

Diga se cada uma das duas sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo caso
ela seja falsa.

[05] Todo problema de otimização possui pelo menos uma solução.

[06] Se um problema de otimização possui uma solução, então ela é única.


1.2 Exercícios 35

Com relação à existência de solução, uma pergunta interessante e, em geral,


difícil de se responder é a seguinte: o conjunto admissível é diferente do
vazio? Afinal, pode ocorrer de não existir ponto algum que satisfaça todas
as restrições simultaneamente. Verificar esta propriedade e até mesmo obter
um ponto admissível explicitamente pode ser uma tarefa difícil, dependendo
do problema.

[07] Mostre que o conjunto admissível do problema da dieta é diferente do


vazio exibindo explicitamente um ponto admissível.

*[08] Mostre que se a soma das gerações máximas Çj das usinas


térmicas é maior ou igual ao valor da demanda dtj para cada estágio í,
então o conjunto admissível do problema do planejamento hidrotérmico
é diferente do vazio.

Formule matematicamente cada um dos problemas abaixo, especificando as


variáveis de controle, a função-objetivo e as restrições (caso existam). Diga
também se o problema é linear ou não-linear. Não é preciso resolvê-lo!

[03] A companhia Vale do Rio extrai minério de ferro em três usinas dife­
rentes. O lucro anual é dado por

L(x, z) = 8 • X • y • — 200000 *{x y z),

onde x^ y e z representam, respectivamente, a quantidade em toneladas


de minério extraídos em cada uma das três usinas. Se a companhia
deseja vender 1000 toneladas de minério de ferro, o quanto cada usina
deve extrair a fim de maximizar o lucro?

[04] A usina ACME utiliza alumínio, ferro, e magnésio para produzir uma
liga de alta qualidade. A quantidade de liga que pode ser produzida
usando-se x toneladas de alumínio, y toneladas de ferro e z toneladas
de magnésio é Q{xj y^z) = x - y ' z. O custo das matérias-primas é dado
na tabela abaixo.

Matéria-prima Custo (R$ por tonelada)


alumínio 12.00
ferro 8.00
magnésio 16.00
36 Por que estudar Cálculo II?

Quantas toneladas de alumínio, ferro e magnésio devem ser comprados


para manufaturar 1000 toneladas de liga de alta qualidade com o menor
custo possível?

[05] Uma determinada empresa está interessada em maximizar o lucro men­


sal proveniente de quatro de seus produtos alimentícios, designados por
I, II, III e IV. Para fabricar esses produtos, ela utiliza dois tipos de
máquinas (Ml e M2) e dois tipos de mão-de-obra (MOl e M02) que
têm as seguintes disponibilidades:

Disponibilidade
Tipo de máquina
(máquina-hora/mês)
Ml 80
M2 20

Disponibilidade
Tipo de mão-de-obra
(homem-hora/mês)
MOl 80
M02 40

O setor técnico da empresa fornece os seguintes coeficientes, que especi­


ficam o total de horas de máquina e horas de mãos-de-obra necessários
para a produção de 1 kg de cada produto.

Produto
Tipo de máquina
I II III IV
Ml 5 4 8 9
M2 2 8 - 8

Produto
Tipo de mão-de-obra
I II III IV
MOl 2 4 2 8
M02 7 3 - 7

O setor comercial da empresa também fornece as seguintes informações:


1.3 Nota histórica 37

Potencial de vendas Lucro unitário


Produto (R$/mês)
(kg/mês)
I 70 10.00
II 80 8.00
III 40 9.00
IV 20 8.00

Deseja-se planejar a produção mensal da empresa que maximize o lucro.

1.3 N ota histórica

O método simplex para resolver problemas de programação linear foi


inventado por George Dantzig em agosto de 1947. Na época, o método foi
utilizado para se resolver o problema da dieta proposto por George Stigler e
um problema de transporte de suprimentos para a antiga Berlim Ocidental.
O problema da dieta proposto originalmente por Stigler, em 1947, possuía
77 variáveis e, para resolvê-lo com o método simplex^ foram necessárias
10 pessoas usando apenas calculadoras de mão. George Dantzig é consi­
derado 0 ‘‘pai” da programação linear.

1.4 Leitura suplem entar

Problemas de programação linear aparecem em muitas áreas: produção de


alimentos, planejamento de produção de fábricas, mineração, planejamento
econômico, gerenciamento de mão-de-obra, descentralização, etc. Uma ex­
celente coletânea de fenômenos que são modelados como um problema de
programação linear é o livro:

1. H. P. Willians, Model Building in Mathematical Programming^ John Wiley


&; Sons, New York, 1979.

Exemplos de fenômenos que são modelados como um problema de pro­


gramação não linear podem ser encontrados nos livros:

2. G. V. Reklaitis, A. Ravindran e K. M. Ragsdell, Engineering Optimiza-


tion: Methods and Applications^ John Wiley & Sons, New York, 1983.
38 Por que estudar Cálculo II?

3. A. Ciriani e R. C. Leachman, Optimization in Industry: Mathematical


Programming and Modeling Techniques, John Wiley & Sons, New York,
1993.
4. P. C. P. Carvalho, L. H. Figuereido, J. Gomes e L. Velho. Métodos de Oti­
mização em Computação Gráfica^ 22- Colóquio Brasileiro de Matemática,
Rio de Janeiro, IMPA, 1999.
5. M. S. Klamkin, Problems in Applied Mathematics, Selections from SIAM
Review^ SIAM, Philadelphia, 1990.

A modelagem usada no problema do planejamento hidrotérmico que apre­


sentamos neste capítulo é apropriada quando o horizonte de tempo para o
planejamento é longa, na escala de anos. Modelagens diferentes são utili­
zadas para horizontes de tempo mais curtos. O problema de planejamento
hidrotérmico admite ainda muitas variações, como a inclusão explícita na
modelagem da perda de energia nas linhas de transmissão ou o tratamento
estocástico para os dados de demanda e afluência. Para maiores detalhes
e para conhecer outros problemas de otimização que aparecem na teoria de
controle e operação de sistemas energéticos, indicamos os livros:

6. A. J. Wood e B. F. Wollenberg, Power Generation and Gontrol^ Second


Editíon, John Wiley & Sons, New York, 1996.
7. G. S. Christensen, M. E. El-Hawary e S. A. Soliman, Optimal Gontrol
Applications in Electric Power Systems^ Plenum Press, New York, 1987.

O NEOS Guide^ um site na World Wide Weh^ fornece um excelente mate­


rial educacional sobre otimização. Vários projetos mostram como a pesquisa
operacional está relacionada com aplicações práticas. A idéia é mostrar ao
leitor detalhes importantes da aplicação, formulação, solução e interpretação
dos resultados para cada projeto. O site é bem interativo. No problema da
dieta, por exemplo, você pode escolher entre dezenas de alimentos, estabe­
lecer a quantidade mínima de nutrientes e, então, calcular a solução ótima.
Para maiores detalhes, indicamos o artigo:

8. J. Czyzyk, T. Wisniewski, S. J. Wright, Optimization Case Studies in the


NEOS Guide^ SIAM Review, vol. 41, no. 1, pp. 148-163, 1999.
Capítulo 2

O espaço euclidiano MP'

Como vimos no capítulo anterior, existem problemas que exigem mais


do que uma única variável para serem modelados. O problema da dieta,
por exemplo, exige 9 variáveis enquanto que o problema de planejamento
hidrotérmico precisa de 480 variáveis.
Neste capítulo vamos estudar o lugar onde estas variáveis “moram” : o
espaço euclidiano MT'. Veremos como generalizar as noções de ponto, reta,
distância e ângulo que aprendemos com o caso da reta numérica (R) e do
plano cartesiano (R^) e que serão muito importantes nos capítulos subseqüen-
tes.

2.1 P ontos e vetores no espaço euclidiano

A re ta real

Em Cálculo I você estudou como representar o conjunto dos números


reais: através da reta numérica. Uma vez que a origem 0 e a unidade 1 foram
escolhidas sobre a reta, cada número real é representado por um único ponto
da reta numérica e, reciprocamente, cada ponto da reta numérica representa
um único número real (veja a figura (2.1)).

+
- 2 - 1 0 1
Figura 2.1: A reta real.
40 O espaço euclidiano

O plano cartesiano

Pares de números também possuem uma representação geométrica: o


plano cartesiano ou o espaço euclidiano de dimensão 2 ^ denotado por
Para representar geometricamente o espaço R^, desenhe primeiro duas re­
tas numéricas perpendiculares: uma horizontal que representa a primeira
coordenada x do par (x, y) e outra vertical que representa a segunda coorde­
nada y de (x, ?/). Tipicamente, estas duas retas numéricas se interceptam em
suas origens e são denominadas eixos coordenados. As unidades escolhidas
para cada eixo podem ser diferentes e, neste caso, estaríamos trabalhando
com escalas diferentes. Em Cálculo I, você utilizou O'plano cartesiano para
representar gráficos de funções de uma única variável.
Como no caso da reta numérica, uma vez que as origens e unidades de
cada eixo coordenado forem escolhidas, cada ponto p do plano cartesiano
está associado com um único par de números (a, 6), da seguinte maneira:
desenhe uma reta vertical l\ e uma reta horizontal I2 passando por p. A
reta vertical intercepta o eixo x em a e a reta horizontal intercepta o eixo y
em ò. Associamos então o par (a, b) com o ponto p. Reciprocamente, para
encontrar o ponto p que representa o par de números (u,6), desenhe a no
eixo X e, por ele, desenhe uma reta vertical l\. Desenhe b no eixo y e, por
ele, desenhe uma reta horizontal I2. A interseção das duas retas l\ e I2 é 0
ponto p. Neste caso, escrevemos p = (a, 6). O número a é denominado a
primeira coordenada de p, e ò é denominado a segunda coordenada de p.
Veja a figura (2.2).
A origem do plano cartesiano é a interseção dos dois eixos coordenados:
0 = (0, 0).

Três ou m ais dim ensões

De maneira análoga, podemos visualizar 0 espaço euclidiano tridimensi­


onal R^ desenhando três retas numéricas perpendiculares entre si. Como
antes, cada reta numérica é denominada um eixo coordenado: 0 eixo x, 0
eixo y e o eixo 2:.
O processo de se identificar um ponto de R^ com uma tripla ordenada de
números reais utiliza as mesmas técnicas que usamos para o plano cartesiano.
Para encontrar o ponto que representa a tripla ordenada (a, 6, c), localize 0
2.1 Pontos e vetores no espaço euclidiano 41

Figura 2.2: Identificando um ponto no plano com um par ordenado.

par que representa (6, c) no plano yz (algo que você já sabe fazer pois trata-se
de uma tarefa em um plano cartesiano). Agora, a partir do ponto (6, c) no
plano j/z, caminhe a unidades na direção paralela ao eixo x determinando,
desta maneira, o ponto p que representa (a, 6, c). Neste caso, escrevemos
p = (a, 6,c). Se você tivesse começado com o par (a, c) no plano xz^ para
depois caminhar b unidades na direção paralela ao eixo j/, você chegaria ao
mesmo ponto p. Outro caminho que também’conduz ao ponto p: caminhe,
a partir do ponto (a, b) no plano xj/, c unidades na direção paralela ao eixo z.
Compare com a figura (2.3)
Não podemos desenhar figuras geométricas dos espaços euclidianos de
dimensão maior ou igual a 4 em nosso mundo tridimensional, mas podemos
usar as figuras de e para guiar nossa intuição. Veremos que as
fórmulas que descrevem objetos geométricos e suas propriedades em R^ e R^
generalizam-se facilmente para dimensões mais altas.
A reta real R^ consiste em todos os números reais. O plano R^ consiste
em todos os pares ordenados de números reais. O termo ordenado indica
que a ordem é importante: o par (1,0) é diferente do par (0,1) (marque
estes pontos no plano cartesiano e veja que eles correspondem a pontos di-
42 O espaço euclidiano

Figura 2.3: 0 ponto p em com coordenadas (a, ò, c).

ferentes). O espaço euclidiano de dimensão n consiste em todas as n-uplas


ordenadas de números reais, isto é, listas ordenadas de n números reais. Por
exemplo, o espaço euclidiano tridimensional (de dimensão 3) contém todas
as triplas ordenadas (a, 6, c) de números reais. O espaço euclidiano de di­
mensão 4 contém todas as 4-uplas ordenadas (a, 6, c, d) de números reais. O
espaço euclidiano de dimensão n será denotado por W e sua origem, que
é a interseção de todos os n eixos coordenados, será denotada por 0. Para
representar um ponto de com suas n-uplas ordenadas, o uso de índices é
muito conveniente: ( x i, X2 , . . . , G

2.2 V etores

Até agora, estamos interpretando W' como uma maneira de se “demarcar’’


a localização de pontos. Por exemplo, o ponto (3, 2) representa uma posição
específica no plano cartesiano: aquela encontrada andando-se 3 unidades à
direita e 2 unidades acima da origem.
Podemos também interpretar n-uplas como deslocamentos e este tipo de
2.2 Vetores 43

interpretação será muito útil na teoria que vamos desenvolver. Vamos repre­
sentar estes deslocamentos através de setas em O deslocamento (3,2)
significa: mova-se 3 unidades para a direita e 2 unidades para cima a partir
de sua posição atual. A extremidade sem ponta da seta indica a posição ini­
cial e a extremidade com ponta indica a posição depois que o deslocamento
foi efetuado. Na figura (2.4), cada seta representa o deslocamento (3,2), mas
em cada caso o deslocamento é aplicado às diferentes posições iniciais.

Figura 2.4: O deslocamento (3,2).

Por exemplo, a seta v na figura (2.4) representa o deslocamento da posição


P = (3,1) para a posição Q = (6, 3). Escreveremos para denotar o deslo­
camento do ponto P para o ponto Q. Duas setas representam o mesmo des­
locamento se elas são paralelas, possuem o mesmo comprimento e o mesmo
sentido. Em outras palavras, se duas setas possuem a mesma direção, o
mesmo comprimento e o mesmo sentido então elas são equivalentes e indi­
cam o mesmo deslocamento.
Mas como identificar uma n-upla com uma seta em R’^? A identificação
é feita medindo-se o quanto nos movemos na direção de cada eixo coorde­
nado a fim de efetuar o deslocamento. Por exemplo, considere a seta v na
figura (2.4). Para sair da posição P = (3,1) e chegar na posição Q = (6, 3),
precisamos nos mover 3 unidades na direção do eixo x e2 unidades na direção
do eixo y. Desta maneira, v representa o deslocamento (3, 2). Mais formal­
mente, se um deslocamento ocorre a partir de uma posição inicial (a, 6) para
uma posição final (c, d), então o movimento na direção do eixo x é c —a.
44 O espaço euclidiano R”

desde que a + (c —a) = c; e o movimento na direção do eixo y é d — desde


que 6+ (d —ò) = d. Portanto, o deslocamento é (c—a ,d - 6). Este método de
subtração coordenada a coordenada também funciona para dimensões mais
altas. Assim, o deslocamento a partir do ponto p = (ai, U2, . . . , Un) para o
ponto q = (6i, 62, • • •, bn) em W é dado por

— (^1 ^2 ^2) • • • ) ^n)*

A figura (2.4) ilustra alguns (dos infinitos) representantes do desloca­


mento (3,2). Por outro lado, em algumas situações, é útil representar os
diferentes deslocamentos a partir de uma mesma posição inicial. Se esta
posição inicial for a origem 0, um fato interessante aparece: o deslocamento
OP confunde-se com a posição P. Com esta ‘‘representação canônica” de
deslocamentos, podemos pensar posições como deslocamentos a partir da
origem. Veja a figura (2.5).

Figura 2.5: Alguns deslocamentos no plano.

Posições e deslocamentos, apesar de serem conceitualmente diferentes,


possuem uma mesma representação matemática: n-uplas de números reais.
Por esta razão, vamos denominá-los com um nome comum: vetores. Será
mencionado explicitamente ou ficará claro pelo contexto, quando uma n-upla
está representando uma posição ou um deslocamento.
2.3 A álgebra de vetores 45

2.3 A álgebra de vetores

Existem quatro operações básicas para o conjunto R dos números reais:


adição, subtração, multiplicação e divisão. Esta seção introduz três opera­
ções algébricas básicas para os espaços euclidianos de dimensão superior: a
adição vetorial, a subtração vetorial e a multiplicação por um escalar.

A dição e su b tração

.A adição (ou soma) de dois vetores é feita através da adição de cada


coordenada do primeiro vetor com a correspondente coordenada do segundo
vetor:
(3,l) + (4,2) = (3 + 4 ,l + 2) = (7,3),
e
(ai, U2, aa) + (6i, 62, h ) = {0,1 + 0,2 + <^3 +
Observe que só é possível fazer a adição de dois vetores que pertençam a
um mesmo espaço euclidiano. Por exemplo, a soma (3,1) + (4, 2, 5) não está
definida desde que 0 vetor (3,1) pertence a R^ enquanto que 0 vetor (4,2, 5)
pertence a R^. Podemos somar (1, 2,4, 0) + (0, 0, 0,8) em R^ obtendo o vetor
(1, 2,4,8) que também está em R'^.
Para desenvolver uma intuição geométrica para a adição vetorial, va­
mos pensar vetores como setas que indicam deslocamentos. Se u = (a, 6)
e V = (c, d) são vetores em R^ então, a partir de alguma posição inicial,
aplique o deslocamento u. Aplique em seguida o deslocamento v a partir da
posição final do deslocamento u. Em outras palavras, a extremidade final
de V coincide com a extremidade inicial de u. Então, u + v representa o des­
locamento da extremidade inicial de u até a extremidade final de v, como
indicado na figura (2.6). Verifique que u + v possui coordenadas (a+c, 6+d).

A figura (2.7) mostra que, na soma u + v, não importa a ordem em que


efetuamos os deslocamentos u e v: aplicando-se u para depois aplicar v ou
aplicando-se v para depois aplicar u, a partir de uma mesma posição inicial,
resultará em uma mesma posição final. Observe que as duas setas repre­
sentando u na figura (2.7) são paralelas e possuem 0 mesmo comprimento
e sentido. O mesmo acontece para as duas representações de v. Assim, o
quadrilátero na figura (2.7) é um paralelogramo. Sua diagonal representa
46 O espaço euclidiano R"

Figura 2.6: A soma de dois vetores no plano.

tanto u + V quando v + u. Em outras palavrats, a figura (2.7) mostra que


u + V = V + u, isto é, que a soma vetorial, como a soma de números reais, é
comutativa. Esta propriedade também pode ser verificada algebricamente:

u + V = (a, 6) + (c, d) = (a + c, 6 + d) =
(c + a, d + 6) = (c, d) + (a, 6) = v + u,

onde, na terceira igualdade, usamos a propriedade de que a soma de números


reais é comutativa.
Físicos usam vetores para representar forças agindo em um ponto. Se os
vetores u e v representam duas forças que agem em P, então o vetor u + v
representa a força resultante da ação simultânea destas duas forças.
A adição vetorial satisfaz as mesmas propriedades que a adição de números
reais: a associatividade, a existência de um elemento neutro (o zero) e de um
elemento inverso. O vetor zero é o vetor que representa um deslocamento
nulo. Algebricamente,
0 = (0 ,0 ,...,0 ).
Geometricamente, 0 é o deslocamento WP cujas extremidades inicial e final
coincidem. Verifique algebricamente e geometricamente que u + 0 = u.
Se u = (ui, -1X2, . . . , Un) então o negativo de u, denotado por —u, é o vetor
(—til, —^'2, • • • j Geometricamente, trocamos as extremidades inicial e
2.3 A álgebra de vetores 47

final de u para obter as extremidades inicial e final de —u. Simbolicamente,


= Q p. Verifique que estas afirmações são consistentes do ponto de
vista algébrico e geométrico e que u + (—u) = 0.
Para os números reais, a subtração (ou diferença) é definida como a —b =
a + (—6). Podemos usar a mesma idéia para definir a subtração de vetores.
Assim,

(1 ,3 ,9 )-(1 ,2 ,4 ) = (1 ,3 ,9 )+ ( - 1 , - 2 , - 4 )
= (l-l,3-2,9-4)
= (0,1,5).

Mais geralmente, para vetores em M^,

(a;i, a;2,. . . , x„) - {yi, ?/2, •.., Vn) - {xi - yi, X2 - y2, ■ ■ ■ ,Xn - yn)-

Geometricamente, x —y “fecha” o triângulo formado pelos vetores x e y na


figura (2.8) ou, colocando de outra maneira, x —y representa o vetor que,
quando somado com y, produz x.

M u ltip lic a ç ã o p o r u m escalar

Não é possível, de uma maneira geral, inventar uma multiplicação de ve­


tores que compartilhe as mesmas propriedades da multiplicação de números
48 O espaço euclidiano R”

Figura 2.8: Representação geométrica de x —y.

reais. Se você definisse a multiplicação de dois vetores como a multiplicação


coordenada a coordenada, então pode ocorrer que a multiplicação de dois ve­
tores diferentes de zero resulte no vetor zero: (1,0)*(0,1) = (1-0,0-1) = (0,0)
(lembre-se que isto não ocorre para a multiplicação de números reais: o pro­
duto de dois números reais diferentes de zero é sempre diferente de zero).
Quando isto acontece, a divisão, que é a operação inversa da multiplicação,
não pode ser definida. Contudo, existe uma operação que podemos fazer: a
multiplicação por um escalar. Nela, multiplicamos um vetor, coordenada a
coordenada, por um número real que, neste contexto, será chamado de um
escalar. Assim, se r é um escalar e x = (cci,... ^Xn) é um vetor, então o
produto de r por x é

r * x = (r * x i , . . . , r

Por exemplo, 3 • (1,2) = (3,6) e ^ • (—6,9) = (-2 , 3).


Geometricamente, a multiplicação de um vetor deslocamento x por um
escalar r não-negativo corresponde a uma expansão ou contração deste des­
locamento pelo fator r, mantendo-se a mesma direção e sentido (veja a fi­
gura (2.9)). Se 0 < r < 1, então temos uma contração e, se r > 1, então
temos uma expansão. Agora, se r é negativo então, além de uma possível
mudança no comprimento do vetor, ocorre também uma mudança de sentido
(a direção do vetor permanece a mesma).
/
Existem leis distributivas nos espaços euclidianos. E fácil de ver que a
2.4 Comprimento, norma e produto interno em R” 49

Figura 2.9: M ultiplicação de um vetor por um escalar no plano.

adição de vetores distribui-se sobre a multiplicação por um escalar e que a


multiplicação por um escalar distribui-se sobre a adição de vetores:
(a) (r -h 5) • u = r • u + s • u para todos os escalares r e 5, e para todos os
vetores u.
(b) r • (u + v) = r • u + r • V para todos os escalares r e para todos os
vetores u e v.
Qualquer conjunto de objetos com uma adição vetorial e uma multi­
plicação por um escalar que satisfaz as propriedades que descrevemos nesta
seção é denominado um espaço vetorial Os elementos do conjunto são de­
nominados vetores.

2.4 Com prim ento, norma e produto interno em

Quando modelamos um determinado fenômeno no espaço euclidiano, es­


tamos interessados nas propriedades geométricas destes espaços: a distância
entre dois pontos, o ângulo entre dois vetores, etc. Nesta seção vamos desen­
50 O espaço euclidiano

volver as ferramentas analíticas necessárias para o estudo destas proprieda­


des. De fato, todos os resultados geométricos da geometria euclidiana plana
(bidimensional) podem ser obtidos usando técnicas puramente analíticas.
Mais ainda, estas técnicas analíticas serão as únicas ferramentas disponíveis
na tentativa de generalização de resultados da geometria plana para espaços
euclidianos de dimensão mais alta, uma vez que não podemos fazer desenhos
de subconjuntos de espaços euclidianos de dimensão maior ou igual a 4.

C o m p rim en to , n orm a e d istâ n c ia

O conceito geométrico mais básico é de distância ou comprimento. Se P


e Q são dois pontos em R^, escreveremos PQ para denotar o segmento de
reta unindo P õl Q e para denotar o vetor deslocamento de P para Q.

O comprimento do segmento de reta PQ será denotado pelo símbolo


||PQ ||. Estamos usando || • || para enfatizar que estamos nos referindo
ao comprimento de um segmento de reta em R^ e reservaremos o uso do
símbolo I • 1para o conjunto R^ dos números reais.

Vamos agora tentar obter uma fórmula para 1|PQ||: a distância entre os
pontos P e Q. Primeiro, considere o caso simples onde P e Q pertencem ao
plano R^ e possuem a mesma segunda coordenada. Veja a figura (2.10), onde
P possui coordenadas (ai, b) e Q possui coordenadas (a2, b). O comprimento
deste segmento de reta é claramente igual à distância entre ai e U2 no eixo x
que, por sua vez, é igual a |a2 —ai|. Concluímos então que ||PQ || = |u2“ ai|.

A seguir, considere o caso (também simples), onde P e Q possuem a


mesma primeira componente. Digamos, P é (a, 6i) e Q é (a, 62), conforme
indicado na figura (2.11), Aqui, a distância é ||PQ || = I&2 —^i|-

Finalmente, considere o caso geral ilustrado na figura (2,12). Para calcular


0 comprimento do segmento de reta r unindo os pontos P = (ai, bl) e Q =
^ , 62), marque o ponto auxiliar R = (u2, 61). Seja s o segmento de reta
(hbrizontal) de P = (ai,òi) até R = (u2, 6i) e seja t o segmento de reta
(vertical) de Q = ^ ^ ^ 2) até R = (a2, 61). O triângulo de vértices P, Q e P
é um triângulo retângulo, cuja hipotenusa é o segmento de reta r. Aplique
2.4 Comprimento, norma e produto interno em 51
52 O espaço euclidiano

O teorema de Pitágoras para deduzir o comprimento de r:

(comprimento de r)^ = (comprimento de 5)^ + (comprimento de í)^


= \a2 — aip + |Ò2 —6i|^.

Tirando a raiz quadrada dos dois lados desta equação, obtemos que

IIPQII = comprimento d e | = y /(u2 —ai)^ + (62 —bi^. (2.1)

Podemos aplicar este argumento para dimensões mais altas. Considere


a figura (2.13). Para encontrar a distância entre P = (a i,6i,Ci) e Q =
(u2, 62,^3) em usaremos o ponto auxiliar R = '(a2,Ò2,ci) que possui a
terceira componente igual à de P e às duas primeiras componentes iguais
as duas primeiras componentes de Q. Desde que P e R possuem a mesma
terceira componente, o segmento de reta P R está contido no plano 2; = ci,
que é paralelo ao plano xy (z = 0). Desde que Q e R possuem as mesmas
duas primeiras componentes, o segmento de reta QR é paralelo ao eixo z
e, portanto, perpendicular ao segm ento^P. Assim, o A P R Q é retângulo,
com hipotenusa PQ. Pelo teorema de Pitágoras,

\\P Q f = \ \ P R \ m \ R Q \ \ \ (2.2)

Desde que RQ é paralelo ao eixo z, seu comprimento é simplesmente |c2—Ci |.


Para encontrar o comprimento de P P , considere S = (u2, 61, ci). Observe que
P S é paralelo ao eixo x e, portanto, possui comprimento |u2 —ai|, e S R é
paralelo ao eixo y com comprimento |Ò2 —6i|. Aplicando então o teorema de
Pitágoras ao triângulo retângulo P P P , concluímos que

\\P R \f = ||P5||2 + ||5ií|l2


= 1^2 — + |í>2 “ ^l|^-
Substituindo este valor em (2.2), obtemos que

ll-PQlP = 1^2 “ + 1^2 “ + \C2 — Ci|^.


Desta maneira, a distância entre P e Q é

\\PQ\\ = 7 ( ^ 2 - a i)2 + (Ò2 - 6l )2 + (C2 - Ci)2. (2.3)

As fórmulas (2.1) e (2.3) generalizam-se para espaços euclidianos de di­


mensão mais alta. Se (xi, X2, . . . , x„) e (yi, j/2, • • •, j/n) são as coordenadas
2.4 Comprimento, norma e produto interno em E” 53

bA

Figura 2.12: Calculando ||P Q || no plano.

Figura 2.13: Calculando o comprimento do segmento P Q em E^.


54 O espaço euclidiano E”

de X e y, respectivamente, no espaço euclidiano de dimensão n, então a


distância entre x e y é

V [y i - XiY + (j/2 - X2y + ----- \-{yn - XnY “ X if ■^


i=\

Vamos usar esta mesma fórmula independentemente de x e y representarem


pontos ou deslocamentos. Lembre-se que x —y é o vetor unindo os pontos
X e y e seu comprimento é ||x —y|| que é igual à distância entre estes dois
pontos. Assim, é natural escrever

||x - y|| = \ / {y\ - Xi)2 + (j/2 - X2)^ - f ---- \-{ y n - XnY-


Em particular, se considerarmos y = 0, então a distância da origem 0 até o
ponto X = (x i,. . . , x„) é

||x|| = ||x - 0|| = , J x \ + x l + -- - + x l .

o número ||x|| é denominado de comprimento ou norma do vetor x.


Podemos agora descrever de maneira mais precisa o efeito da multiplicação
por um escalar sobre a norma de um vetor v. Se r é um escalax positivo, a
norma de r • v é r vezes a norma de v. Se r é um escalar negativo, a norma
de 7* • V é |r| vezes a norma de v.

Teorema 2,1 ||r • v|| = |r| • ||v|| para to,doT-em'R e v em ■

Demonstração:
|| r-v|| = ||r-(ui,...,i;„)||

= \/( r • ui)2-h • • • -f (r • v„)2


= i/r2 • •••-!-u2)

= kl • + ••• + (desde que V t^ = |r|)


= kl -l lv ll .

Dado um vetor v não-nulo, precisaremos no capítulo sobre derivadas di­


recionais (capítulo 8) calcular um vetor u que possui a mesma direção e
2 .4 Comprimento, norma e produto interno em R" 55

sentido que v mas de norma 1. Tal vetor u será denominado vetor unitário
na direção e sentido de v. Para obter um tal vetor u, basta multiplicar v
pelo escalar r = ||^ , isto é, basta dividir v pela sua norma. Isto funciona
pois
1 1
m = — M l = ijçü • IMI = 1.
IMl"' IMI

E x e m p lo 2.1 A norma do vetor v = (1, —2,4) em é

l|v|| = V 1 2 + ( - 2)2 + 42 = V ^ .

Segue-se que

V 1 . , / 1 —2 4 \
“ ■ iMi “ ^ V lij
é um vetor com mesma direção e sentido de v mas de norma 1.

O produto interno

Nas seções anteriores aprendemos como somar e subtrair dois vetores.


Aprendemos também como calcular o tamanho (norma) de um vetor. Nesta
seção vamos introduzir uma outra operação: o produto interno euclidiano.
Esta operação atribui a cada par de vetores um número real. Veremos que
este número está relacionado com a noção de “ângulo entre dois vetores” e,
portanto, ele será muito útil na análise de problemas geométricos.

Definição 2.1 (P rOdxjtO interno) Sejam, u = (tq,..., Un), e v s=


{vi, . .., v„) dois vetores em R". O produto interno eucUdianó-àe.ix.e
V, denotado por u •y, é o número rèai ,'

U • V = 1Í1 • Vi -b ÍÍ2 ‘ Ü2 H---- H- % • Vn = ‘ '

Para enfatizar que o resultado da operação é um escalar, o produto interno


euclidiano também é chamado de produto escalar.
56 O espaço euclidiano R”

E x e m p lo 2.2 Se u = (1, —2, —4) e v = (1,3, —9) então

u • V = 1 • 1 + (-2 ) • 3 + (-4 ) • (-9 ) = 1 - 6 + 36 = 31. .

O teorema a seguir resume as propriedades analíticas básicas do produto


interno — propriedades que usaremos com muita freqüência neste livro. A
demonstração não é difícil e ficará como um exercício para você.

....Teorema 2.2,„Sejam u; v e w vetores quaisquer em R” e seja r um


escalar arbitrário. Então

(b) u ■(v + w ) = u • V + u • w ,
(c) u (r • v) = r • (u • v ) = (r • u) • V,
ÍÍÍÍIp fc l l BBM Íh M ilM lllM BlÍÍB iÍw ÍIIÍÍÍÍÍB M iÍi^^B ÍÍÍB B ^
(e) u • u = 0 implica que u = 0, e
( f ) (u + v ) • ,(u + v) = u • u + 2 >(u • v ) + V • V.

O produto interno euclidiano está fortemente relacionado com a norma


euclidiana de um vetor pois

u - u = u l + u l + ■■■+ u l e l|u|| = y ju l + u l + --- + u l,


de modo que
||u|| = \/u • u.
Conseqüentemente, a distância entre dois pontos x e y pode ser escrita em
termos do produto interno

l|x - y || = V ( x - y) • (x - y).

É sempre possível colocar dois vetores u e v de R" em um plano, como


mostra a figura (2.14). Neste plano podemos medir o ângulo 6 entre u e v.
O produto interno fornece uma importante conexão entre as normas de u e
V e o ângulo 9 entre u e v.

T e o r e m a 2 .3 Sejam u e v dois vetores em R". Seja 9 o ângulo entre

i n -v= ||u ||.||v||.cos(«).


2.4 Comprimento, norma e produto interno em R” 57

Figura 2.14: 0 ângulo entre dois vetores em R’^.

O bservação. Vamos lembrar como medir o cosseno de um ângulo. Consi­


dere a figura (2.15) e o ângulo agudo 6 = Z.BAC, Trace a perpendicular de
B até D com relação à reta que contém os pontos A eC . Então, no triângulo
retângulo BAD^ o cosseno de é a divisão da medida do lado adjacente AD
pela medida da hipotenusa AB. Se 0 é um ângulo obtuso (isto é, um ângulo
entre 90 e 270 graus) então, conforme o diagrama na figura (2.16), o cosseno
de 0 é o negativo de ||>1Z)||/||A5||.
Observe que o cosseno de 6 está sempre entre —1 e + 1, pois a medida de
um lado de um triângulo retângulo é sempre menor ou igual que a medida
da hipotenusa do triângulo. Note que

se 0 é agudo, então cos{9) > 0,


se ^ é obtuso, então cos(0) < 0,
se 0 é um ângulo reto. então cos(0) = 0.

D em onstração do teo rem a (2.3): Vamos usar novamente o teorema de


Pitágoras. Sem perda de generalidade, podemos trabalhar com vetores u
e V cujos representantes possuem extremidade inicial na origem, digamos,
u = e V = Õ ^. Seja I a reta que contém o vetor v, isto é, a reta
passando pelos pontos 0 e Q. Trace o segmento de reta s perpendicular por
P (a extremidade final de u) até a reta /, como indicado na figura (2.17).
Seja R o ponto onde s encontra 1. Desde que R pertence a /, o vetor ÕÂ é
58 O espaço euclidiano R”

Figura 2.15: cos(0) = ||A Z)||/||i4.B ||.

Figura 2.16: Calculando o cosseno de um ângulo obtuso: cos(^) = —||A L)||/||>Ü3||.

um múltiplo escalar de v = Assim, ÕÂ = í • v. Desde que u, í • v e o


segmento s são os três lados do triângulo retângulo OPR^ podemos escrever
s como o vetor u —í • v. Uma vez que u é a hipotenusa deste triângulo
retângulo,
cos{6) = (2.4)
,|u|| l|U||
Por outro lado, pelo teorema de Pitágoras e pelo teorema (2.2), o quadrado
da medida da hipotenusa é:
l|u||" = | | í . v ||2 + | | u - í . v | l 2
= r |v ||2 + ( u - í - v ) - ( u - í - v )
= e |v|p + V • V - 2 • u • (í • v) + (í • v) • (í • v)

ou
2 • í • (u • v) = 2 • 'Iv||2.
Segue-se que
u •V
í= (2.5)
2.4 Comprimento, norma e produto interno em K" 59

Figura 2.17: Escolha t de modo que v e u —í •v sejam perpendiculares.

Substituindo (2.5) em (2.4) obtemos que


U •V
cos{6) =
U

0 próximo exemplo ilustra como podemos usar o produto interno para cal­
cular ângulos explicitamente.

E xem plo 2.3 Vamos usar o produto interno para calcular o ângulo entre a
diagonal de um cubo e um de seus lados. Considere um cubo em de lado c.
Vamos representar este cubo com os vértices em O = (0, 0, 0), Pi = (c, 0, 0),
P2 = (0, c, 0) e P3 = (0,0, c), como indicado na figura (2.18). Sejam

ui = O f{, U2 = ÕP2 e U3 = OP3.


Então, a diagonal d é ui -|- U2 -|- U3, isto é,
d = Ui d- U2 + U3 = (c, c ,).
O ângulo 9 entre Ui e d satisfaz
Ui • d _ (c, 0, 0) • (c, c, c) 1
cos(0) =
|ui|| • ||d|| c • V^c2"+cM-c^ c- y/3 • \/3
Usando uma tabela trigonométrica ou uma calculadora, você encontrará que
se cos{9) = l/\/3 , então 9 = arccos(l/\/3) w 54°44'. 1
60 O espaço euclidiano

Figura 2.18: Cubo de lado c.

Teorema 2.4 O ângulo entre os vetores u e v não-nulos em K” é


(a) agudo se nt • v > 0,
(b) obtuso se u • V < D e
(c) reto se u • V = 0.

Dificilmente estaremos interessados no valor do ângulo. A propriedade


que realmente nos interessa é saber se o ângulo é agudo, obtuso ou reto.
Desde que cos(^) é positivo quando 9 é agudo, negativo quando 9 é obtuso
e zero quando 9 é um ângulo reto, o teorema (2.3) ensina como utilizar o
produto interno para obter esta classificação.
Quando este ângulo é reto, dizemos que u e v são ortogonais. Assim, os
vetores u e v são ortogonais se, e somente se, u •v = ui •ui -|------\-Un-Vn = 0,
um cálculo fácil de se fazer.
Estamos cometendo um abuso no caso em que um dos vetores é zero.
Quando o produto escalar é zero, 9 não está definido. Contudo, o conceito
de ortogonalidade prevalece nesta situação, pois consideraremos que o vetor
zero é ortogonal a qualquer outro vetor.
Finalmente, usaremos o teorema (2.3) para obter uma propriedade básica
2.4 Comprimento, norma e produto interno em R" 61

da norma, a desigualdade triangular. Esta regra afirma que qualquer lado


de um triângulo é sempre menor ou igual que a soma dos outros dois lados.
Intuitivamente, isto segue do fato que um segmento de reta fornece o ca­
minho mais curto entre dois pontos de R” . Na notação vetorial, queremos
demonstrar que
||u + v|l < ||u|| + ||v||, para todo u, v € R” .
A figura (2.19) ilustra a equivalência desta formulação analítica com as pro­
priedades geométricas de triângulos.

T eorem a 2.5 (D esigualdade triangular) Para quaisquer dois


vetores u e v em R” vale que

|u + v ||< ||u || + ||v|| ( 2 . 6)

D em onstração; Se u = 0 ou v = 0, o resultado é imediato. Para o caso


u 7^ 0 e V ^ 0, lembre que
u •V
< 1.
U
pelo teorema (2.3). Portanto,
u •v < U
|ulP + 2 . ( u . v ) + ||v|p < ||u|p + 2 .||u| V + v
u • u-b u • v-h v • u-t-v • v < |u|| + ||v||)%
(u -h v) • (u -I- v) < |u|| + ||v ||)^
l|u + v||2 < |u|| + i|v ||)^
|u + v|| < ||u|| + ||v||.

A desigualdade triangular (2.6) é muito útil. Quase toda sentença ma­


temática que envolve uma desigualdade utiliza a desigualdade triangular
em sua demonstração. O próximo teorema apresenta uma variante da de­
sigualdade triangular que também será de uso em nosso estudo, especi­
almente quando desejarmos encontrar uma cota inferior para alguma ex­
pressão. Para entender melhor este resultado, você deve testá-lo com vários
pares de números reais, especialmente pares com sinais opostos.
62 O espaço euclidiano

Figura 2.19: u, v e u + v são os três lados de um triângulo.

T eorem a 2,6 Para quaisquer dois vetores x e y em W vale que

M |-IH I|< l|x -y ||. (2.7)

Demonstração: Aplique a desigualdade triangular com u = x —y e v = y,


para obter a desigualdade l|x|| < ||x —y|l + ||y||, isto é,
lx||-|ly||<||x-y||. ( 2.8)

Agora aplique a desigualdade triangular com u = y —x e v = x, para obter


a desigualdade ||y|| < ||y —x|| + ||x||, isto é,
- ||x|| < | | y - x | | = | | x - y | | . (2.9)
As desigualdades (2.8) e (2.9) implicam que | ||x|| —||y|| | < ||x —y||. ^

As três propriedades básicas da norma euclidiana são:


(1) ||u|| > 0 e ||u|| = 0 se, e somente se, u = 0.
(2) ||r • u|| = |r| • ||u||.
(3 ) |lu + v| |<||u || + |M|.
Qualquer função que a cada vetor associa um número real satisfazendo estas
três propriedades é denominada uma norma. Nos exercícios você encontrará
outras normas que surgem naturalmente em aplicações.
2.5 Retas 63

2.5 R etas

Pontos, retas e planos são os objetos fundamentais da geometria eucli­


diana plana. A fim de estender estes conceitos para espaços euclidianos de
dimensão > 2, vamos agora estudar como descrever retas e planos vetorial­
mente.
No ensino médio, você aprendeu que retas são descritas pela equação

y — m - x + h. (2.10)

O coeficiente angular m é a inclinação da reta (a tangente do ângulo entre


a reta e o eixo x, no caso particular em que uma mesma escala é utilizada
para se desenhar os dois eixos coordenados) e o coeficiente linear ò é o ponto
onde ela intercepta o eixo y. Esta representação algébrica é útil para se
resolver equações mas não é muito adequada para uma descrição geométrica
que possa ser generalizada. Por exemplo, qual é a equação da reta r na
figura (2.20)? Para ela, não podemos resolver y em termos de x. Precisamos
de uma representação geral e que realmente expresse a geometria da reta.

Uma representação paramétrica de um ponto sobre uma reta é uma ex­


pressão (x(í), y[t)), onde o parâmetro t é um número real. O ponto x = [x, y)
64 O espaço euclidiano R”

pertence à reta se, e somente se, x = {x{t*),y{t*)) para algum valor t* do


parâmetro t. Você pode pensar que t representa um tempo e que (x(í), y{t))
representa a posição de um ponto material neste instante de tempo.
Para descrever uma reta parametricamente são necessários apenas dois
ingredientes: um ponto xq por onde a reta passa e um vetor v que fornece a
direção da reta. Geometricamente, as diferentes posições da trajetória de uni
ponto que se move sobre uma reta, a partir do ponto Xq, na direção de um
vetor V , podem ser obtidas somando-se múltiplos escalares de x à posição
inicial Xq (veja a figura (2.20)). O resultado é a representação paramétrica
x{t) = Xo + í • V. (2-11)
Você pode pensar que (2.11) descreve a trajetória de um ponto material

deslocando-se em movimento retilíneo uniforme a partir de uma posição ini­


cial Xo e velocidade v.
E xem plo 2.4 Considere a reta na figura (2.20) que passa pelo ponto (4,2)
e move-se diretamente para o nordeste, isto é, na direção do vetor (1,1). Sua
representação paramétrica é
x(í) = {x{t),y{t))

= (4 -h t • 1, 2 + t • 1)
A figura (2.20) mostra que (5,3) e (1 ,-1 ) pertencem à reta. O primeiro
ponto é alcançado quando í = 1 e o segundo quando t = —3.
2.5 Retas 65

Observe que uma mesma reta pode ser descrita por equações paramétricas
diferentes. Por exemplo, podemos representar a reta que passa pelos pon­
tos (4, 2) e (5, 3), na figura (2.20), através do ponto (—1, 1) e do vetor (2, 2).
Neste caso, obtemos a parametrização
{x{t),y{t)) = (1, -1 ) + í . (2,2) = (1 + 2 . í, - 1 + 2 . t).
Com esta parametrização, a reta passa por (4,2) quando t = 1.5 e por (5,3)
quando t = 2 . Esta segunda parametrização descreve uma trajetória de um
ponto material com posição inicial (1, —1) e com o dobro da velocidade da
trajetória descrita por í i-)- (4 + 1, 2 + í). b

Naturalmente, a parametrização (2.11) funciona em todas as dimensões.


Por exemplo, a reta em que passa pelo ponto xq = (2, 1,3) na direção de
V = (4, —2, 5) possui equações paramétricas

x(í) = (l(í),J/(í))
= (2, 1, 3)+ í - (4, -2, 5)
= (2 + 4 - í , l - 2 - í , 3 + 5-í).

Uma outra maneira de se determinar uma reta é identificar dois pontos


distintos por onde ela passa. Considere uma reta I e os pontos p Ç. I e q E l,
com p ^ q. Então q —p fornece uma direção para I e, conseqüentemente,
podemos escrever
x(í) = p + < • (q - p)
= p + í - q —í - p (2-12)
= (1 - í ) - p + í - q .
Quando í = 0 estamos no ponto p e quando í = 1 estamos no ponto q.
Quando í está entre D e l estamos em um ponto intermediário entre p e q.
Por exemplo, em í = 1/ 2, x ( l / 2) é o ponto médio do segmento unindo p e
q. Conseguimos então obter uma parametrização para o segmento de reta
unindo p a q

Kp >^) = {(^ “ ^) ■P + ^ ■<1 I 0 ^ ^ ^ 1} -

Dados dois pontos p = (a, 6) e q = (c, d) distintos sobre uma reta I no


plano, podemos representar I através de uma equação paramétrica
x(í) = (1 - í) • p + í • q
66 O espaço euclidiano

OU através de uma equação não-paramétrica


d -b
y -b = [x — a).
c —a
Não é difícil fazer a conversão de uma forma para a outra. Por exemplo, se
r x — 4 -|-1 *1,
{ y = 2 + t • 1,
então podemos isolar t nas duas equações
X — 4: 2/ —2 , , x —4 y — 2
t = —-— e t = —-— de modo que —-— = .—-— ou y — x — 2 .

Finalmente, observe que a equação y = m • x + h é uma representação não-


paramétrica da reta que passa pelo ponto (0,6) na direção do vetor (1, m).

2.6 Planos

Equações p ara m étrica s

Uma reta é unidimensional e isto reflete o fato de que podemos descrevê-


la com apenas um único parâmetro. Planos são bidimensionais e, por esta
razão, é natural que, para descrevê-los, sejam necessários dois parâmetros.
Seja V um plano em passando pela origem. Sejam v e w dois vetores
em V, como indicados na figura (2.22). A escolha de v e w é feita de modo
que eles apontem para direções diferentes, em outras palavras, v e w são tais
que nenhum deles é um múltiplo escalar do outro (neste caso, dizemos que v
e w são linearmente independentes). Para quaisquer escalares s e í, o vetor

s •V + t •w

é denominado de combinação linear de v e w. Se variarmos s e t n o conjunto


dos números reais, que conjunto vamos obter? Se t = 0 e s percorre o
conjunto dos números reais, então x = s • v percorre a reta que passa pela
origem com vetor diretor v. Analogamente, se 5 = 0 e t percorre o conjunto
dos números reais, então x = t • w percorre a reta que passa pela origem
com vetor diretor w. Agora, para diferentes combinações dos parâmetros
s e f, pela interpretação geométrica de multiplicação por escalar e soma de
vetores, é fácil ver que x = s- v + f- w é um ponto do plano V. De fato.
2.6 Planos 67

todo ponto do plano V pode ser escrito como uma combinação linear de v e
w. A equação

X = s • Vi + t • 1^1,
x = 5*v + í* w ou y = S -V 2 + t - W 2j
^ z = s- vz + t -ws,

fornece, portanto, uma parametrização do plano V.

Figura 2.22: Um plano V passando pela origem.

Se O plano não passa pela origem mas por um ponto p ^ ^ O e s e v e w


são vetores linearmente independentes representados em p então, conforme
indicado na figura (2.23), podemos usar o método acima para parametrizar
este plano pela equação

x = p + s- v + t - w , G (2.13)

Da mesma maneira que dois pontos não-coincidentes determinam uma


única reta, três pontos não-colineares determinam um único plano. Para
encontrar a equação paramétrica do plano que contém os pontos p, q e r,
observe que q —p e r —p são deslocamentos a partir no ponto p no plano V.
68 O espaço euclidiano

Figura 2.23: Um plano não passando pela origem.

Desta maneira, uma parametrização deste plano é dada por

x (s,í) = p + s - ( q - p ) + í • ( r - p )
(2.14)
= (1 —s —í ) - p + s - q + í - r .

Compare (2.14) com a equação paramétrica (2.12) de uma reta. A partir


da equação (2.14) podemos ver que um plano é o conjunto de todas as
combinações lineares de três pontos fixos cuja soma dos coeficientes é 1:

X = íi •p + Í2 *q + •r. (2.15)

Se, além disto, exigirmos que os escalares ti em (2.15) sejam não-negativos,


então o conjunto resultante de todas as combinações lineares é o triângulo
(o interior inclusive) cujos vértices são p, q e r — a região sombreada na
figura (2.24). Os números Í2 e são denominados coordenadas ba-
ricêntricas do ponto x deste triângulo. Por exemplo, as coordenadas ba-
ricêntricas do vértice p são (1,0,0), pois iti = 1, = 0 e ^3 = 0 na
expressão (2.15) produz o ponto p. Analogamente, as coordenadas ba-
ricêntricas dos vértices q e r são (0,1,0) e (0,0,1), respectivamente. O
2.6 Planos 69

centro de massa ou centróide deste triângulo é o ponto

1 1 1
x=3P+3-q+3r,

cujas coordenadas baricêntricas são (1/3,1/3,1/3).

Figura 2.24: Triângulo com vértices p, q e r.

As equações (2.13) e (2.14) fornecem uma parametrização de um plano


bidimensional em qualquer espaço euclidiano, não apenas em Por exem­
plo, o plano bidimensional passando pelos pontos (1,2,3,4), (5,6,7, 8) e
(9, 0,1, 2) em possui as seguintes equações paramétricas

xi = l - r + 5*5 + 9-í,
X2 = 2-r + 6- 5 + 0-t,
2^3 = 3*r + 7*5 + l*í,
X4 = 4-r + 8- 5 + 2-t, onde r + s + t = 1.
70 O espaço euclidiano

Equações n ão -p aram étricas

Existe uma outra maneira de se representar um plano em algebrica-


mente, através de equações não paramétricas. Como no caso da reta, um
plano pode ser determinado a partir de dois ingredientes: um ponto e uma
inclinação. A inclinação é especificada através de um vetor n, denominado o
vetor normal, que é perpendicular ao plano. Considere um plano passando
por p = (xo, 2/Oj zq) e com um vetor normal n = (a, ò, c). Se x = (x, y, z) é um
ponto qualquer deste plano, então o vetor x —p pode ser representado neste
plano e, conseqüentemente, ele será perpendicular a n (veja a figura (2.25)).

Figura 2.25: Plano passando por v com vetor normal n.

Lembrando que dois vetores são perpendiculares se, e somente se, o pro­
duto interno entre eles é zero, podemos escrever
0 = n • (x - p) = (a, 6, c) • (x - xq, y ~ y Q , z - zq),
ou
a • (x - Xo) + ò • (y - yo) + c • (z - zo) = 0. (2-16)
A equação (2.16) é denominada equação normal do plano. Ela é freqüente-
mente escrita na forma
a - x + 6 - y + c - z = d, (2-17)
2.7 Exercícios 71

onde, neste caso, d = a • jjq + ò • yo + c • ^o- Reciprocamente, se a 0, 6 7^ 0


e c 7^ 0, podemos interpretar a equação (2.17) como a equação do plano que
passa pelos pontos (0, 0, d/c), (0, d/6, 0) e (d/a, 0, 0).
Exem plo 2.5 A equação do plano passando por (1, 2, 3) e com vetor normal
(4,5,6)é
4 • (x —1) + 5 • (y —2) + 6 • (2; —3) = 0 ou 4 • a; + 5 • y + 6 • 2; = 32. ^
Exem plo 2.6 A equação S ^ x - y + A-z = 12 é uma equação não-paramétrica
do plano passando por (4,0, 0) (ou (0,0, 3) ou (0, —12, 0) ou (5,7,1)) e com
vetor normal n = (3, —1,4). b

H iperplanos

Uma reta ei^ e um plano em são exemplos de conjuntos descritos por


uma única equação linear em Tais espaços são denominados hiperplanos.
Uma reta em pode ser representada algebricamente pela equação
Ui • Xi + U2 *X2 = d,
e um plano em R^ pela sua equação normal
a^i *X\ “h U2 *^2 T U3 *x^ —d.
Analogamente, um hiperplano em R’^ pode ser representado algebricamente
pela equação
ai ' Xi + a2 ' X2 a^i' Xji = d.
Se o coeficiente é diferente de zero, então você pode considerar que a
equação acima descreve todos os vetores com origem em (0, . . . , 0, a^/d) que
são perpendiculares a n = (ui,. . . , a^).

2.7 Exercícios

[01] Desenhe uma reta numérica, escolha a origem e a unidade e, em seguida,


marque os pontos 2, 3/2, —2 e \/2.
[02] Desenhe um plano cartesiano, escolha as origens e as unidades de cada
eixo coordenado e, em seguida, marque os pontos: (1,2), (1/2,3/2),
(-1 ,0 ) e (3, n/2).
72 O espaço euclidiano R”

[03] Para os pontos p e q abaixo, desenhe o vetor deslocamento e calcule


a n-upla correspondente a
( a ) p = (0,0) e q=(l,l),
( b ) p = (l,2) e q=(3,l),
( c ) p = (l,2 ) e q = ( 0,0),
(d) p = (0,1) e q = (3,1),
[04] Para os pontos p e q abaixo, desenhe o vetor deslocamento ^ e calcule
a n-upla correspondente a
(a) p = (0,0,0) e q = (1,2,1),
( b ) p = (0,1,0) e q = (2,1,3).
[05] Sejam u = (1,2), v = (0,1) e w = (1 ,-3 ). Calcule algebricamente e
geometricamente os seguintes vetores: u + v, —4 • w, 2 • v, u + 2 • v e
u —V.
[06] Sejam x = (1,2,0) e z = (0,1,1). Calcule algebricamente e geometri­
camente os seguintes vetores: 3 • z, 3 • x -f z e —2 • x.
[07] Encontre as coordenadas dos pontos P, Q e R no retângulo na fi­
gura (2.26). O retângulo está desenhado de forma que seus lados são
paralelos aos eixos coordenados ~

(3.2)

(- 2 . - 1 ) 14 Q

Figura 2.26; Um retângulo cujos lados são paralelos aos eixos coordenados.

[08] Encontre os valores de x e y tais que (—21,23) — (x, 6) = (—25, y).

[09] Mostre que —u = (—1) • u.

[10] Demonstre as propriedades distributivas para vetores em R”.


2.7 Exercícios 73

[11] Use a figura (2.27) para dar uma demonstração geométrica da proprie­
dade associativa para a adição de vetores: u + (v -|- w) = (u -f v) + w.

[12] Sejam Ui = (1, 0, 0), U2 = (1,1,0), U3 = (1,1,1) e v = (2,1,3). Encon­


tre, se é que existem, números reais ai, 0^2 e 0:3 tais que v = U1 + U2+ U3.

[13] Encontre a norma de cada um dos vetores dados abaixo.

(a) (2,0), (b) (1,2,3), (c) (3, 0, 2, 0, 1).

[14] Encontre a distância entre os pontos P e Q em cada caso abaixo.

(a )P=(0,0) e Q=(3,-4),
(b) P = ( l , l , - 1) e Q = (2, - 1,5),
(c) P = (l,2,3,4) e Q = (1 ,0 ,-1 ,0 ).

[15] Para cada par de vetores a seguir, determine se o ângulo entre eles é
agudo, obtuso ou reto e, então, calcule este ângulo.

( a ) u = (l,0 ) e v = (2,2),
( b ) u = (1,1,0) e v = (1,2,1),
(c) u = (1,0,0,0,0) e v = (1,1,1,1,1).

[16] Encontre um vetor de norma 1, mas de mesma direção e sentido, para


os vetores (3,4), (6,0), (1,1,1) e (—1,2, —3).
74 O espaço euclidiano

[17] Encontre um vetor de norma 3, mas de mesma direção e sentido, para


os vetores (3,4), (6,0), (1,1,1) e (-1 ,2 , -3 ).
[18] Mostre que se u e v são vetores tais que ||u|| = ||v|l, então u + v e u —v
são vetores ortogonais.
[19] Seja u = {u\^U2^u^) um vetor unitário, onde ui, e são números
reais diferentes de zero. Determine um número real t de forma que os
vetores
V = (—í • W2,í • Wi, 0), w = {t • Ui • us,t • U2 *u s,—l/t) e u
sejam unitários e dois a dois ortogonais.
[20] Use o produto escalar para mostrar que o ângulo inscrito em um se­
micírculo é reto. Dica: adapte o exercício [18] com os vetores u e v
indicados na figura (2.28).

Figura 2.28: O ângulo inscrito em um semicírculo é reto.

[21] Demonstre que ||u — v |p = ||u |p - 2 • (u • v) + ||v|p.


[22] Mostre que as funções
11(^1,U2)l| = |ui|-f|'U2| e
||(ui,'U2)l| = m a.x{\uil\u 2 \}
satisfazem as três propriedades de uma norma em Generalize estas
definições para W .
2.7 Exercícios 75

[23] Sejam u e v dois vetores não paralelos. Mostre que os vetores

u* = u /||u || e V* = í; —(u • u*) • u*

são ortogonais.
[24] Demonstre o teorema (2.2).
[25] Considere um paralelepípedo retângulo de tamanho 2 cm x 3 cm x 4 cm.
Encontre o ângulo entre a maior diagonal com a aresta de tamanho 4
cm.
[26] Use a notação vetorial para demonstrar que as diagonais de um losango
são ortogonais. Veja a figura (2.29).

F igura 2.29: Se ||u || = ||v ||, então este quadrilátero é um losando.

[27] Sejam ui, U2, ...., vetores não-nulos, dois a dois mutuamente orto­
gonais, isto é. Ui • uj = 0 para i ^ j. Mostre que se ai, a2, . . . , são
números reais tais que

Cl • Ui + C2 • U2 + ---- h Cn • Un = 0,

então Cl = C2 = • • • = cVi = 0.
[28] Demonstre as identidades abaixo.
(a) |lu + vl|2 + l l u - v ||2 = 2 . | | u| p + 2 .||vlp.
(b ) u . v = i . | | u + v | p - i . | | u - v | | 2 .

[29] Mostre que se u e v são vetores ortogonais, então [[u + v |p = ||u||^ +


ll,,|2||
76 O espaço euclidiano

[30] O produto vetorial é uma multiplicação de vetores em para a qual o


produto de dois vetores em R^ é um outro vetor em R^. Ele é definido
como segue, com o uso da notação de determinantes:

{Ui,U2,Uz) X {vi,V 2,Vz) =


{ U 2 - V z - U z - V 2 , U z - V i - U i - Vz, U2 ‘ V2 ~ U2 •Vl),.

OU, ainda.
U2 us Ui Us Ui U2
u XV= det , —det , det
V2 V3 Vi V3 Vl V2
onde u = (ui, U2, U3) e v = (ui, U2, U3). Prove as seguintes propriedades
do produto vetorial:
(a) u X V = —V X u.
(b) u X V é perpendicular a u.
(c) u X V é perpendicular a v.
(d) (r • u) X V = r • (u X v) = u X (r • v).
(e) (ui + U2) X V = (ui X v) + (u2 X v).
(f) | | u x v | p = ||u |M |v ||2 - ( u . v ) 2.
(g) ||u X v|| = ||u|| • ||v|| • sen(0) (use o item (f) e 0 teorema (2.3)).
(h) u X V = 0.
(i) Se w = {wi^W2^w^) então

( Ui U2 us
Vl V2 V3
Wi U)2

[31] Mostre que o produto interno pode ser representado simbolicamente


como
/ ei 02 03
u X V = det u\ U2 U3
V Vl V2 Vz
onde 01 = (1, 0, 0), 02 = (0,1,0) e 03 = (0, 0,1). Considere Oi, 02 e 03
como símbolos na expansão do determinante.
[32] Use o produto vetorial para encontrar um vetor perpendicular a u e
V nos casos: (a) u = (1,0,1), v = (1,1,1) e (b) u = (1 ,-1 ,2 ), v =
(0 ,5 ,-3 ).
2.7 Exercícios 77

[33] Considere o paralelogramo determinado pelos vetores u e v em , como


indicado na figura (2.30).
(a) Mostre que a área deste paralelogramo é ||u x v||. Dica: expresse
h em termos de \i, \ e 9.
(b) Encontre a área do retângulo em R^, cujos vértices são (1, —1, 2),
(0,1,3) e (2,1,0).

Figura 2.30: O paralelogramo gerado por u e v.

[34] Mostre que o ponto médio do segmento /(x, y) ocorre quando t =


Em outras palavras, se z = ^ • x + ^ • y, então ||x —z|| = jjy —z||.
[35] Para cada par de pontos Pi e P2 a seguir, escreva a equação paramétrica
da reta passando por Pi e P2, encontre o ponto médio do segmento
í(Pi, P2) e faça um esboço da reta.
( a ) pi = (3,0) e P2 = (5,0),
( b ) pi = (l,0) e P2 = (0,l),
(c) Pi = (1,0,1) e P2 = (2,1,0).
[36] O ponto (11,14,17,18) pertence à reta (1,2,3,4) + í • (5,6,7,8)?
[37] Encontre as equações não-paramétricas das retas descritas parametri-
camente a seguir.
X = 4 —2 • í, X — 3 -|- X — 3+
(a) (b) (c)
y = 3 -H6 • í. y = 5-t. y = 5.
[38] Mostre que í i-> (1 -|- 2 í ,2 -|- 6t, 3 -h 4í) e s h->- (2 -h s , 5 + 3 s , 5 -|- 2 s),
com í € R e s € M, parametrizam uma mesma reta.
78 O espaço euclidiano R”

[39] Encontre as equações paramétricas das retas descritas não-parametri-


camente a seguir.

(a) 2 • j/ = 3 • X + 5, {h) y = —X + 7, (c) x = 6.

[40] O ponto (4,3,2) pertence ao plano (1,2,3) + s ♦(1,1,0) + í • (0,1,1)?


[41] Escreva as equações paramétricas e não-paramétricas das retas que pas­
sam pelos pares de pontos indicados a seguir.

(a) (1,2) e (3,6), (b) (1,1) e (4,10), (c) (3,0) e (0,4).

[42] Escreva as equações paramétricas dos planos em indicados abaixo.

(a) xi + X2 + X3 = 3, (b) xi - 2 • X2 + 3 • X3 = 6.

[43] Escreva as equações paramétricas e não-paramétricas dos planos que


passam pelas triplas de pontos indicados a seguir.

(a) (6,0,0), (0, - 6 ,0) e (0,0,3), (b) (0,3,2), (3,3,1) e (2,5,0).

[44] Encontre uma equação não-paramétrica para os planos indicados a se­


guir.

(a) O plano passando pelo ponto (1, 2,3) e com vetor normal (1, —1,0).
(b) O plano passando pelo ponto (1,1, —1) e perpendicular à reta defi­
nida parametricamente por (xi, X2, X3) = (4 —3 • í, 2 -h í, 6 + 5 • í).
(c) O plano passando pelos pontos (a, 0,0), (0,6,0), (0,0, c), com a, 6
e c todos diferentes de zero.

[45] Encontre uma representação paramétrica para a interseção dos planos


x + y + z = l e 2 x — z = 3 em R^.

[46] Se ai, . . . , an-, 61, . . . , 6„ são números reais quaisquer, obtenha uma
demonstração da desigualdade de Cauchy-Schwarz,

^ ^ • 62 ^ E “i
2= 1 \U ' \ü
usando o teorema (2.3).
Capítulo 3

Funções escalares com várias variáveis

Como vimos, muitos problemas em áreas científicas são modelados com


o uso de muitas variáveis. Neste capítulo vamos estudar os objetos ma­
temáticos adequados para a representação desses problemas.

3.1 Lembrando Cálculo I

Vamos considerar um exemplo bem simples de uma função de uma vari­


ável, definida pela expressão algébrica:

y = f{x) =

Toda função tem um domínio e um contradomínio. Em nosso caso, o domínio


de / é o subconjunto mais amplo do conjunto de todos números reais (R)
para os quais podemos efetuar as operações indicadas na expressão. Como
podemos elevar qualquer número ao quadrado, vem que o domínio de / é o
conjunto de todos os números reais:

Domínio de / = M.

Dado que a função / “devolve’’ um número real e nenhum contradomínio foi


indicado explicitamente, vamos assumir que

Contradomínio de / = R.

Uma função é uma regra que associa a cada ponto do domínio, um único
ponto do contradomínio. Assim, por exemplo, a função / acima associa o
número real x = 0 ao número real y = /(O) = 0^ = 0. Analogamente, ela
80 Funções escalares com várias variáveis

associa x = 1 a ?/ = / ( l ) = 1^ = 1, x = - 1 a y = / ( “ !) = = 1»
X = \/5 a j/ = /(\/5 ) = (\/5)^ = 5, a; = 7raj/ = / ( tt) = tt^, e assim por
diante. Estas associações podem ser representadas geometricamente através
de um diagrama, conforme indicado na figura abaixo.

TT

7T

1
0
-1

Domínio de / Contradomínio de /

Contudo, é difícil conseguir informações importantes do comportamento


de / (como, por exemplo, crescimento, decrescimento, máximos, mínimos,
etc) através desta representação geométrica.
Você aprendeu em Cálculo I que a representação geométrica adequada
para se estudar uma função real é através de seu gráfico. O gráfico de uma
função nada mais é do que a coleção de todos os pares ordenados da forma
f{x)), com X no domínio de / . Mais formalmente:

D efinição 3 . 1 (G E Á F IC O D E UMA FUNÇÃO DE UMA VARIAVB l )


Dada uma função / : Z) C ® R de uma variável, o gráfico de /
é 0 subconjunto do plano cartesiano R^ = R x R definido por

e D e y ^ f{x)}.

De maneira informal, o gráfico de uma função / nada mais é do que ‘Ajuntar’’


o domínio e o contradomínio de / em um mesmo desenho (o domínio em um
3.2 Funções de duas variáveis 81

eixo e 0 contradomínio em outro eixo) e fazer a representação de / através


dos pontos da forma (x, /(x )), com x variando no domínio da função.
Em nosso exemplo, os pares ordenados (0,0), (1,1), (—1,1), (\/5 ,5) e
(tt, 7T^) são pontos do gráfico de y = f{x) = x^. Por outro lado, o ponto
(3,15) não é um ponto do gráfico da função. Tente justificar estas afirmações!
Um esboço do gráfico de y = f[x) = x^ está na figura (3.1) e é nossa
conhecida parábola. Esta função é realmente muito simples. Para o caso
de funções definidas por expressões algébricas mais complicadas, você pode
utilizar as técnicas aprendidas em Cálculo I para fazer um esboço represen­
tativo do gráfico de / . Finalmente, observe que através do gráfico de / po­
demos responder todas as questões de interesse: crescimento, decrescimento,
máximos, mínimos, etc.

Figura 3.1: Esboço do gráfico de ?/ = /(x) =

3.2 Funções de duas variáveis

E xem plo 3.1 (O parabolóide elíptico de revolução ) Não vamos


ser muito ambiciosos: vamos começar com uma função de duas variáveis bem |$ I
simples, definida pela expressão algébrica
82 Funções escalares com várias variáveis

A função é de duas variáveis porque ela associa cada par de números


reais x e ?/ ao número real >2: definido como a soma dos quadrados áe x e y.
Ou, com uma notação mais compacta, podemos dizer que ela associa o par
ordenado [x^y) ao número real 2; = x ‘^ + y‘^. Como a expressão algébrica
que define / pode ser calculada para qualquer escolha dos valores de x e y,
temos que o domínio de / é todo o plano cartesiano = M x R:
Domínio de / = = R x R.
Como antes, dado que a função / “devolve” um número real e nenhum
contradomínio foi indicado explicitamente, vamos assumir que
Contradomínio de / = R.

Vamos calcular / em alguns pontos: /(O, 0) = 0^ + 0^ = 0, / ( 0 , 1) = 0^ +


12 = 1, / ( l , 1) = l2 + 12 = 2, / ( l , -1 ) = l2 + (-1)2 = 2 e /(\/2 /2 , V2/2) =
1/2 + 1 / 2 = 1. Novamente, essas associações podem ser representadas geo­
metricamente através de um diagrama, conforme indicado na figura abaixo.

Como antes, é difícil conseguir informações importantes do comporta­


mento de / através desta associação de pontos onde domínio e contradomínio
são representados separadamente. Uma representação geométrica conveni­
ente é tentar representá-los em um único desenho, isto é, através do gráfico
da função / .
3.2 Funções de duas variáveis 83

Como 0 domínio de / precisa de 2 eixos para ser representado e o contra-


domínio precisa de 1 eixo, então o gráfico de / precisa de 3 eixos para ser
representado. O gráfico de / é o subconjunto de x R formado pelas
triplas ordenadas da forma {x,y, f{x,y)), com {x,y) no domínio de / . Mais
formalmente:

Definição 3.2 (G ráfico de uma função de duas variáveis )


Dada uma função / : D C R^ ^ R de duas vaxiáveis, o gráfico de / é o
subconjunto do espaço euclidiano tridimensional R^ = R^ x R definido

((cc,2/, z) e R^ = R^ X R [ (x,y) e D e t = f{x, y)}.

Por exemplo, o ponto (1,1,2) é um ponto do gráfico de / e o seu desenho é


dado na figura abaixo.

Outros pontos de R^ que também pertencem ao gráfico de / são (0,0,0),


(0,1,1), (1 ,-1 ,2 ) e (V ^/2,-\/2/2,1). Por outro lado, (2,2,15) não é um
ponto do gráfico de / . Tente justificar estas afirmações!
Como conseguir um bom esboço do gráfico de /? Você poderia ser tentado
a fazer uma tabela de valores {x,y, f{x, y)) para alguns valores de x e y e,
em seguida, desenhar os pontos obtidos. Se você tentar utilizar esta técnica
para 10 valores de x entre —2 e 2 e 10 valores de y entre —2 e 2, obtendo
então 100 pontos do gráfico de / , o que você verá é a figura (3.2). Como
você pode observar, o resultado não é promissor!
84 Funções escalares com várias variáveis

Figura 3.2: Desenho de 100 pontos do gráfico de ^ + 2/^.

Vamos estudar agora uma técnica mais eficaz, que consiste em se fazer
uma “tomograíia computadorizada” do gráfico da função, isto é, vamos de­
terminar a interseção do gráfico com diversos planos (algo supostamente
mais fácil de se fazer) e, a partir destas interseções, tentar fazer um esboço
do gráfico da função.
Por exemplo, considere o plano z = isto é, o conjunto de todos os pontos
de da forma (a:, y, 1), com x, y G R. Este plano é paralelo ao plano xy e
passa pelo ponto (0,0,1) (veja a figura (3.3)). Que figura geométrica obtemos
quando fazemos a interseção deste plano com o gráfico da função? Se um
ponto (x, y, z) pertence ao gráfico da função / , então z = /(x , y). Por outro
lado, se o ponto também pertence ao plano, então sua terceira componente
é 1, isto é, z = 1. Combinando estes dois fatos temos que
f { x, y) = z = l,
ou seja, vale a equação
+ = 1.
Moral da história: a interseção do gráfico da função z = /(x , y) = x"^ + y"^
com o plano z = 1 é a circunferência de raio 1, contida no plano z = 1 e de
centro em (0,0,1) (veja a figura (3.4)).
3.2 Funções de duas variáveis 85

Figura 3.3: Desenho do plano z = 1 passando pelo ponto (0,0,1).

Figura 3.4: Interseção do plano z = 1 com o gráfico de 2: = /(x , y) = + y^.


86 Funções escalares com várias variáveis

Vamos tentar outros '‘cortes” (interseções).


• Com o plano z — 2 .
Este plano é paralelo ao plano xy e passa pelo ponto (0, 0, 2). Os pontos
{x^y^z) da interseção são caracterizados por satisfazerem ^ = f{x^y) (o
ponto está no gráfico de f ) e z = 2 {o ponto está no plano). Assim,
2 = z = f {x, y) = x ‘^ + y'^- Moral da história: a interseção do gráfico de /
com o plano z = 2 é a, circunferência de raio y/ 2 , contida no plano z = 2
e de centro em (0,0,2) (veja a figura (3.5)).

Figura 3.5: Interseção do plano z = 2 com o gráfico de 2; = f { x^y) = + y^.

• Mais geralmente, com o plano z = onde k é uma constante > 0.


Este caso é completamente análogo ao caso anterior. O plano z = k é
paralelo ao plano xy e passa pelo ponto (0, 0,fc). Na interseção com o
gráfico de / vale a equação k = z = f{x^y) = isto é, temos a
circunferência de raio \/k contida no plano z = k e de centro em (0,0, k),
• Com o plano z = Q.
Observe que o plano z = Q é justamente o plano xy. Como antes, Q = z =
/(x , y) — x^ + O único valor de x e y que satisfaz esta equação é x = 0
3.2 Funções de duas variáveis 87

e y = 0. Moral da história: a interseção do gráfico de / com o plano z = 0


é o ponto (0,0, 0).

• Com o plano z = —1.


Este plano é paralelo ao plano xy e passa pelo ponto (0, 0, —1). Na in­
terseção com o gráfico de / temos —1 = z = /(x , j/) = Não existem
números reais x e y que satisfazem esta equação. Moral da história: não
existe interseção entre o gráfico de / e o plano z = —1 .

• Mais geralmente, com o plano z = onde k é uma constante < 0.


Este caso é completamente análogo ao caso anterior. O plano z = k é
paralelo ao plano xy e passa pelo ponto (0,0, A;). Na interseção com o
gráfico de / vale a equação A: = z = /(x , y) = x^ + y^. Como k é negativo,
esta equação não tem solução e, portanto, não existe interseção entre o
gráfico de / e planos da forma z = k^ com k negativo.

Vamos resumir os resultados obtidos: à medida que tomamos planos


paralelos, mas “por cima” do plano xy (isto é, com valores de z maiores
do que zero), obtemos uma circunferência com centro no eixo 2:. Quanto
mais próximo do plano xy estivermos, menor será o raio da circunferência.
Quando tomamos o próprio plano xy, obtemos apenas 0 ponto (0, 0,0). Pla­
nos paralelos, mas “por baixo” do plano xy (isto é, com valores de z menores
do que zero), possuem interseção vazia com o gráfico de / .
Estes resultados já permitem inferir um primeiro esboço do gráfico de / ,
mas eles ainda não são suficientes. Observe a figura (3.6). Qual figura repre­
senta melhor o gráfico de z = /(x , y) = x^ + y^? A figura (a) ou a figura (b)?
Nas duas figuras obtemos circunferências quando fazemos “cortes” com os
planos da forma z = k.
Para obter um esboço melhor é preciso fazer cortes com outros tipos de
planos. Por exemplo, com planos da forma y = A;, que representa o conjunto
de todos os pontos de da forma (x, fc, z), com x, z G R (veja a figura (3.7))
ou com planos da forma x = A;, que representa o conjunto de todos os pontos
de R^ da forma (fe, y, z), com y, z G R (veja a figura (3.8)).
Vamos então estudar a interseção do gráfico de / com planos da forma
y = A;, com k uma constante real.
88 Funções escaleires com várias variáveis

(a)

Figura 3.6: Qual figura representa melhor o gráfico de 2; = f { x , y) = y ‘^1

Figura 3.7: Desenho do plano y = k passando pelo ponto (0, k, 0).


3.2 Punções de duas variáveis 89

Figura 3.8: Desenho do plano x = k passando pelo ponto {k, 0,0).

• Com 0 plano y = 1.
Este plano é paralelo ao plano xz e passa pelo ponto (0,1,0). Na interseção
deste plano com o gráfico de / temos y = 1 e z = f{x, y) =
Portanto, vale a equação
z= + 1.
Moral da história: a interseção do gráfico de / com o plano y = 1 é a
parábola z = x^+1 no plano y = 1 com vértice (0,1,1) (veja a figura (3.9)).

• Com 0 plano y = 0.
Observe que o plano y = 0 é justamente o plano xz. Como antes, y = 0 e
z = /(x , y) = x^ + y^. Portanto, vale a equação
n2 = X2.
z = X +, U
.V

Moral da história; a interseção do gráfico de / com o plano y = 0 é a


parábola z = x^ no plano xz com vértice (0,0,0) (veja a figura (3.10)).
90 Punções escalares com várias variáveis

Figura 3.9: Interseção do plano y = l com o gráfico de z = /( x , y) =

Figura 3.10: Interseção do plano y = 0 com o gráfico de z = /(x , y) = x^ + y^


3.2 Funções de duas variáveis 91

• Com o plano y = — 1.

Este plano é paralelo ao plano xz e passa pelo ponto (0, —1,0). Na in­
terseção deste plano com o gráfico de / temos y = —l e z = f i^^y) =
+ j/^. Portanto, vale a equação

z= + (—1)^ = + 1.

Moral da história: a interseção do gráfico de / com o plano y = —1 é


a parábola z = x^ + 1 no plano y = —1 com vértice (0, —1,1) (veja a
figura (3.11)).

Figura 3.11: Interseção do plano y = —1 com o gráfico de 2: = /( x , y) = + y ’^.

• Mais geralmente, cóm 0 plano y = k, onde k é uma constante real.


Os cálculos são exatamente os mesmos: como y = k e z = x ‘^ + y‘^ então,
z = x^^ + k‘^. Moral da história: a interseção do plano y = k com 0 gráfico
de / é a parábola z = x^ + P no plano y = k com vértice (0, A;, A;^).

Com estes planos adicionais é possível eliminar 0 desenho (b) na figura (3.6)
— um cone — como candidato a gráfico da função 2: = /(x, y) = x^ + 2/^
pois, como vimos, a interseção do gráfico de / com o plano y = 0 é uma
92 Funções escalares com várias variáveis

parábola, enquanto que a interseção deste plano com o cone é um par de


semi-retas (no formato de um “V”).
E as interseções com os planos da forma x = k? Fica como exercício
demonstrar que a interseção do gráfico de / com o plano x = k é a, parábola
z = + k‘^ no plano x = k com vértice (A;, 0, k"^).
Para encerrar, na figura (3.12), temos o gráfico de z = f{x^y) =
gerado por computador. Nela também aparecem as curvas resultantes da
interseção do gráfico de / com os planos 2: = 0.0, 2: = 0.5, z = 1.0, z = 2.0,
z = 2.5, z = 3.0, z = 3.5, z = 4.0, z = 4.5, y = —1, 2/ = 0 e j / = l . g

Figura 3.12: Gráfico de 2: = f { ^ , y ) = x ^ + gerado por com putador


3.2 Funções de duas variáveis 93

Exem plo 3.2 (O p a r a b o l ÓIDE h i p e r b ó l i c o ) Vamos fazer mais um (im­


SI
portante) exemplo juntos. Considere agora o parabolóide hiperbólico (tam­
bém conhecido como a sela de cavalo) definido pela expressão algébrica:

z = f { x, y) = x^ - y ^ .

É fácil de ver que o domínio de / é e que seu contradomínio é R. Para


fazer um esboço do gráfico, vamos utilizar a técnica de ‘‘cortes” com os planos
z = k ^y = k e x = k. Começaremos com os planos da forma z = k.

• Com o plano z = 1 .
Temos 1 = z = f{x^y) = logo a interseção do gráfico de / com o
plano z = 1 é a hipérbole = 1, com vértices (—1,0,1) e (1,0,1),
neste plano (veja a figura (3.13)).

• Mais geralmente, com o plano z = k, onde k é uma constante > 0.


Este caso é completamente análogo ao caso anterior: temos k = z =
/(x , y) = —2/^, logo a interseção do gráfico de / com o plano ^ = A: é a
hipérbole x^ —y^ = com vértices (—\/fc, 0, k) e {Vk, 0, fc), neste plano.
Observe que quanto menor o valor de k (isto é, quanto mais k estiver
próximo de 0), mais os vértices da hipérbole tendem a se aproximar.

• Com o plano z = 0 (o plano xy).


Temos 0 = z = /(x , y) = x^ —y^. Então x^ —y^ = (x —y) • (x + y) = 0.
Portanto, x —y = 0 o u x + y = 0, isto é, y = x ou y = —x. Desta maneira,
a interseção do gráfico de / com o plano z = 0 é o par de retas y = x e
y = —X, passando pelo ponto (0,0,0), neste plano (veja a figura (3.13)).

• Com o plano z = —1.


Temos —1 = z = /(x, y) = —y^ ou, ainda, multiplicando-se por —1,
—x^ + y^ = 1. Desta maneira, a interseção do gráfico de / com o plano
•z = —1 é a hipérbole —x^ -f y^ = com vértices (0, —1, —1) e (0,1, —1)
(compare com o caso z = 1 e observe a mudança do eixo da hipérbole),
neste plano (veja a figura (3.13)).

• Mais geralmente, com o plano z = A:, onde k é uma constante < 0.


Este caso é completamente análogo ao caso anterior: temos k = z =
f{x, y) — y^ ou, ainda, multiplicando-se por —1, —x^ -\- y^ = —k.
Desta maneira, a interseção do gráfico de / com o plano z = k éa. hipérbole
94 Funções escalares com várias variáveis

—x^ + y‘^ = —k, com vértices (0, —\ í ^ , k ) e (0, \ / ^ , fc), neste plano.
Observe que quanto maior o valor de k (isto é, quanto mais k estiver
próximo de 0), mais os vértices da hipérbole tendem a se aproximar.

Figura 3.13: Interseção do gráfico z = com os planos 2: = l,2; = 0e2: = - l .

Mesmo com estas interseções, ainda está muito difícil compor um bom esboço
do gráfico de / . Vamos tentar utilizar outros planos, por exemplo, x = k,
com k uma constante real.
Vamos tratar diretamente do caso geral ao invés de fazer alguns casos
específicos primeiro pois, a esta altura, você já deve ter adquirido prática
nesta técnica de “cortes”. Bem, como na interseção temos z = íip^^v) =
—2/^ e X = fc, segue-se que z = k'^ — Moral da história: a interseção do
plano X = k com o gráfico de / é a parábola z = }^ —y^ com vértice (i, 0, A;^)
no plano rr = A; (as parábolas estão com concavidade “voltada para baixo”).
Também não é difícil de perceber que os vértices (A;, 0, A;^) destas parábolas
descrevem outra parábola, z = que nada mais é do que a interseção do
3.2 Funções de duas variáveis 95

plano 2/ = 0 com o gráfico da função / .


Agora está mais fácil de visualizar o gráfico de /: você pode imaginar
uma seqüência de parábolas z = com concavidade “voltada para
baixo’’, cujos vértices estão sobre a parábola z — (veja a figura (3.14)),
formando uma “sela de cavalo” .

Figura 3.14: Parábolas z = “dependuradas” sobre a parábola z =

Para encerrar, na figura (3.15), temos o gráfico de 2: = /(x , y) =


gerado por computador. Nela também aparecem as curvas resultantes da
interseção do gráfico de / com os planos 2; = —12.0, 2: = —10.0, 2; = —8.0,
2: = —6.0, 2; = —4.0, 2: = —2.0, 2: = 0.0, 2: = 2.0, z = 4.0, 2: = 6.0, 2: = 8.0,
2T= 10.0, 2: = 12.0 e X = 0.0. a

Estas duas funções, 2: = - ^2


e 2: = junto com a função
z = -X 2- y 2
(cujo gráfico pode ser obtido fazendo-se a reflexão do gráfico de 2: = x^ +
com relação ao plâno xy), apesar de simples, são muito importantes. Como
veremos, sob certas condições, elas descrevem o “comportamento” de funções
mais complicadas nas proximidades de candidatos a extremo local.
Funções escalares com várias variáveis

Figura 3.15: Gráfico de 2: = f { x ^y ) gerado por com putador.


3.3 Curvas de nível 97

3.3 Curvas de nível

Fazer a interseção do gráfico de uma função / de duas variáveis com


planos da forma z = k serve mais do que apenas nos auxiliar na construção
de um esboço do gráfico de / . Esta interseção motiva um dos objetos mais
importante na teoria que vamos desenvolver aqui: o conceito de curva de
nível.
Suponha, por um momento, que a função z = f{x^y) = 2:^ + 2/^, estudada
no exemplo (3.1), represente 0 lucro de uma determinada empresa em função
das quantidades x e y de dois insumos diferentes. Uma pergunta muito
natural que se pode fazer é: quais são todas as possíveis combinações nas
quantidades x e y dos insumos que produzam lucro igual a 1? Por exemplo,
X = 1 e y = 0 produzem lucro 1. Outras combinações que produzem lucro 1
são (0,1), ( - 1 ,0 ) , ( 0 ,- 1 ) , (V 2 / 2 , V 2 / 2 ).

Mas como determinar todas as combinações? Bem, se o lucro deve ser 1,


então z = 1 (pois z = f{x^y) = + representa justamente o lucro obtido
com uso das quantidades x e y de insumos). Desta maneira, x e y devem
satisfazer a equação
1 = + y^.
Descobrimos então que os únicos pontos que produzem lucro 1 são os pares
ordenados sobre a circunferência de centro na origem (0,0) e raio 1. Observe
que 0 modo como a equação desta circunferência foi deduzida é completa­
mente análogo ao processo de se determinar a interseção entre o gráfico de f
e 0 plano z = 1 \ Isto motiva a definição de curva de nível:

D e fin iç ã o 3 .3 (C urva de nível ) Seja / • D C -4 M uma função


de duas variáveis com domínio D. Dado um número (nível) 6 K,
definimos a curva de nível associada a k como o conjunto

{(®,í/) € jD C I/(a:,í/) = Â:} ,

isto é, o conjunto de todos os pontos do domínio de / para os quais o


valor da função é k.

Por exemplo, para a função z = f{x, y) = x ‘^ + y‘^, a curva de nível associada


ao nível 1 é a circunferência {{x,y) € 1 + j/2 _ 1}, a curva de nível
98 Funções escalares com várias variáveis

associada ao nível 0 é o conjunto {(0,0)} formado apenas pelo ponto (0,0)


e a curva de nível associada ao nível —1 é o conjunto vazio.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Apesar de você poder identificar uma curva de nível fazendo a interseção


do gráfico da função com planos da forma z = k, lembre-se que o desenho
da curva de nível deve ser feito do domínio da função (isto é, no plano xy)
e não no plano z = k.

Você pode imaginar que, se calculássemos o valor da função / na posição


ocupada por uma formiguinha (pontual) andando sobre a curva de nível
z = f {x, y) = k no plano rry, veríamos sempre o mesmo valor k.
Exercício resolvido 3.1 Considere a função
2 = f{x, y) -- In - l) .
Faça um esboço do domínio de f e uma descrição de suas curvas de nível.

Solu ção: Uma vez que a função logarítmica 11-)- ln(í) está definida apenas
3.3 Curvas de nível 99

para valores positivos de t, segue-se que — 1 > 0, isto é, e®'*'*' > 1.


Lembrando que In é uma função crescente e é inversa da função exponencial
t i-> é , obtemos que In (e®'*'*') = x + y > ln(l) = 0 e, portanto, y > —x.
Assim,

Domínio de / = {(x, j/) € \y > — ■


Vamos agora tentar obter uma descrição das cmvas de nível de / . Para
z = k temos

z = k^\n - l ) = k<^ - 1 = e* = 1 -)- e*= ^


X -h y = In (e®’’’®') = In (l + e*’) •O’ y = —x -t- In (l -f e*') ,

isto é, a curva de nível associada ao nível z = k é â reta y = —x -|- In ( l- f e*)


no plano xy, paralela à reta y = —x e passando pelo ponto (O, In (l -|- e*)).
Na figura (3.16) temos as curvas de nível y = —x -H In (l + e"^), y = —x -I-
In (2) e y = —x -f In (l -H e^) associadas aos níveis z = —2, z = 0 e z = -1-2,
respectivamente. Observe que quanto maior é o valor de k, mais a reta
y = —X -h In (l + e*) se distancia de y = —x e, por outro lado, quando k
tende a —oo, y = —x -|- In (l -|- e*) tende à reta y = —x. h
100 Funções escalares com várias variáveis

Figura 3.16: Curvas de nível z = —2, z = 0 e z = -\-2 dâ função z = f{x^ y) = In — 1).

3.4 Funções de três variáveis e superfícies de nível

Exemplo 3.3 Considere a função de três variáveis definida pela expressão


algébrica _______________
w = f { x , y, z ) = \ / 9 — — 3/^ —

Não podemos calcular a função para qualquer escolha d e x, y e z. Por


exemplo, o ponto (10,0,0) não está no domínio de / . Os pontos do domínio
satisfazem a desigualdade 9 —x ‘^—y ‘^ —z'^ > 0, isto é, < 9. Assim

Domínio de / = { (x, y, z) € | x^ + + z^ < 9} .

Geometricamente, o domínio de / é a bola, isto é, a fronteira e o interior


da esfera de centro na origem (0, 0, 0) e raio 3 (veja a figura (3.17)). Como
a função / “devolve” apenas um número real, e nenhum contradominio foi
indicado explicitamente, vamos assumir que

Contradominio de / = R.

E o gráfico da função / ? Uma vez que o domínio d e f é um subconjunto


de R^ e 0 contradominio de / é R, o gráfico de / é um subconjunto de R"*
3.4 Funções de três variáveis e superfícies de nível 101

-- 0

Domínio de / Contradomínio de /

Figura 3.17: Domínio e contradomínio de w = f { x , y, z) = — z^.

e, portanto, ele não pode ser desenhado adequadamente em nosso mundo


tridimensional. Contudo, ainda é possível fazer a representação geométrica
de uma superfície de nível de / , isto é, do conjunto de todos os pontos (x, y, z)
do domínio da função para os quais /(rc,y, = fc, com k uma constante.
Mais formalmente:

D e fin iç ã o 3 .4 ( S u p e r f í c i e d e n í v e l ) Seja / : D c R uma


função de três variáveis com domínio D, Dado um número .(nível)
Ar 6 R, definimos a superfície de nível associada a Ar como ò conjunto

■ € jD C R® I f ( x , y , z ) = k ] ,

isto é, o conjunto de todos os pontos do domínio de / para os quais o


valor da função é Ã.

Em nosso exemplo, vale o seguinte:

• Se A: < 0, então a superfície de nível é o conjunto vazio, pois a função raiz


quadrada sempre devolve um número > 0.•

• Se A: > 3, então a superfície de nível é o conjunto vazio, pois 9—x^—y^—z^ <


9, de modo que f { x , y , z ) = — ^ = 3, isto é, não
102 Funções escalares com várias variáveis

existem pontos (x, y, z) no domínio da função / para os quais / ( x , y, z) > 3!

• Se 0 < A: < 3, então a superfície de nível é a esfera

{(x,y, z) E \ + y'^ + z^ = 9 - k^}


de centro em (0, 0, 0) e raio VÕ"— pois

/(x , z) = k a/ 9 — —y^ — 2:^ = k


9— — y^ — 2:^ = + y^ + = 9—

Em particular, para A; = 3, a superfície de nível é o conjunto { (0 ,0 ,0 )}


formado apenas pelo ponto (0, 0, 0).

Desta maneira, a função / é constante sobre cada esfera de centro (0 ,0 ,0 ) no


domínio de / . Se uma formiguinha (pontual) caminhasse sobre uma mesma
esfera de raio r, o valor da função na posição por ela ocupada seria constante
e igual a \/9 — r^. b

E x e m p lo 3.4 Considere a função de três variáveis definida pela expressão


algébrica

w - f{x, y, z) - z - - y^.

É fácil de ver que o domínio de f é todo e que o contradomínio de /


é R. O gráfico de f é um subconjunto de R"^ e não pode ser desenhado
adequadamente. O melhor que podemos fazer aqui é tentar determinar quais
são as superfícies de nível de / .
Como você já deve estar com bastante prática, vamos atacar o caso geral
diretamente:

w = f { x , y , z ) = k ^ 2; — —y^ = A; z= + y^ + fc.
onde k é uma constante real.
Moral da história: a superfície de nível de / associada ao nível k nada
mais é do que a translação do gráfico do parabolóide elíptico de revolução
estudado no exemplo (3.1) com relação ao eixo z de |A:| unidades “para cima”
(isto é, no sentido positivo do eixo z), se A; > 0 e |A;| unidades “para baixo”
(isto é, no sentido negativo do eixo z) se k < 0. Na figura (3.18) estão
desenhadas as superfícies de nível w = —2, w = 0 e w = 2 de f . ^
3.5 Funções de n variáveis e hiperfícies de nível 103

Figura 3.18: Superfícies de nível áe w = z —x'^ - y ^ para os níveis w = —2, w = 0 e w = +2

3.5 Funções de n variáveis e hiperfícies de nível

Considere a função de quatro variáveis definida pela expressão algébrica


u = / ( x , ?/, 2:, w) = x‘^+ y'^+ z^ + w'^. O domínio de / é 0 contradomínio é
R e, portanto, o gráfico de f é um subconjunto de R^! Agora, não podemos
representar nem o gráfico de / , nem qualquer hiperfície de nível de / (isto é, 0
conjunto de pontos ( x ,y ,z , w) E R^, tais que / ( x , y^z,w) = k = constante).
A mesma dificuldade ocorre para qualquer função que dependa de n > 4
variáveis.
O que faremos é estudar situações com 2 ou 3 variáveis, onde podemos
utilizar a geometria para intuir resultados e, posteriormente, mostrar que
estes resultados são verdadeiros mesmo para funções de muitas variáveis.
Para terminar, aqui está um exemplo de função de n variáveis:
r, N
Xi + X2 + • • • +
m = / ( x i , X2 , . . . , Xn) = ---------------------------------- =
— ---------- ,
n n
que a cada ponto (xi, X 2 , . . . , Xn) de R’^ associa a média aritmética m destes
números, e a definição formal de hiperfície de nível:
104 Funções escalares com várias variáveis

D e t o iç ã o 3 .5 ( H i p e e f í c í b d e n í v e l ) Seja / : D C M” - 4 R uma
fuação de n variáveis com domínio D. Dado um número (nível) fc € R,
definimos a Mperfície de nível associada a k como o conjunto

® 2 ) • • • ) S'»!,) € D C R j f{píi íT2 ) • • > íT n ) ~ >

istò é, o conjunto d^ tódos os pontos do domínio de f paia os quais o


valor da função é kJ

3.6 Exercícios

[01 ] Mostre que a interseção do parabolóide elíptico de revolução

z = f { x, y) = x'^ + y^
com 0 plano x = k é â parábola z = + k^, no plano x = k, com
vértice {k, 0, k^).

[02] Faça um esboço do gráfico de z = f{x, y) = —x^ — identificando as


interseções do gráfico com planos da forma z = k, y = k e x = k. Faça
também um esboço das curvas de nível da função.

[03] (A e lip se ) O objetivo é descrever geometricamente o conjunto de pon­


tos em R^ que satisfazem a equação da elipse

- +^ = 1 (*)
o2 ^ 62 ’
com o e 6 números reais positivos (ou, em outras palavras, justificar
porque a elipse (*) tem o desenho que você já conhece). Vamos usar
Cálculo I para fazer isto: uma vez que
y2
- r -i ^ = 1 se, e somente se.

y = f{x) = 6- y i - ^ o u y = y(x) = -6 •y 1 -

basta determinar os gráficos de / e 5 (funções reais em uma variável)


a fim de obter a representação geométrica de (*). Utilize 0 que você
aprendeu em Cálculo I (domínio, crescimento, concavidade, extremos
locais, etc) para obter os gráficos de / e 5 e, em seguida, montar um
esboço do desenho da elipse (*).
3.6 Exercícios 105

[04] (A hipérbole) Utilize a idéia do exercício anterior para descrever geo­


metricamente o conjunto de pontos de que satisfazem a equação da
hipérbole

O? 62 ’
com a e 6 números reais positivos.
[05] (O parabolóide elíptico) Resolva as questões abaixo.
(a) Faça um esboço do gráfico de z = h{x^ y) = x^jA+y"^ jQ identificando
as interseções do gráfico com planos da forma z = k^y = k e x = k.
Faça também um esboço das curvas de nível da função.
(b) Faça um esboço do gráfico de z = g{x^ y) = 4 + 9 identificando
as interseções do gráfico com planos da forma z = k , y = k e x = k.
Faça também um esboço das curvas de nível da função.
(c) Mais geralmente, faça um esboço do gráfico de

(**)

com a e b constantes positivas, identificando as interseções do gráfico


com planos da forma z — k^y = k e x = k. Faça também um esboço
das curvas de nível da função. O que acontece quando a = b?
(d) Quais são os valores de a e 6 na equação (**) para as funções h e g
dos itens (a) e (b)? E para a função do exemplo (3.1) na página 81?
O gráfico da função (**) recebe o nome de parabolóide elíptico.
[06] Por que você acha que o gráfico da função z = /(x ,y ) = + j/^/6^
do exercício anterior recebe o nome de parabolóide elíptico? Por que
não chamá-lo de elipsóide parabólico?
[07] Por que você acha que o gráfico da função z = f {x, y) = — y‘^ es­
tudada no exemplo (3.2) na página 93 recebe o nome de parabolóide
hiperbólico? Por que não chamá-lo de hiperbolóide parabólico?
[08] Faça um esboço das curvas de nível da função ^ = g{x,y) = 2 • x • y.
Compare com as curvas de nível do parabolóide hiperbólico estudado
no exemplo (3.2). O que você conclui?
*[09] Faça um esboço do gráfico de z = /(x , y) = max{|x|, |y|} identificando
as interseções do gráfico com planos da forma z = k , y = k e x = k.
Faça também um esboço das curvas de nível da função.
106 Funções escalares com várias variáveis

[10] Considere a função z = = ln(e^'*'^ —1) definida no exercício


resolvido (3.1).
lêl
(a) Escreva a equação da curva de nível de / que passa pelo ponto (8,2)
e da curva de nível que passa pelo ponto (—2, 3).
(b) Mais geralmente, escreva a equação da curva de nível de / que passa
pelo ponto (a, 6), com 6 > —a.
(c) Mostre que o valor de / sobre a reta y = —x + 2 é constante, isto
é, que y = —X + 2 é uma curva de nível de / .
(d) Mostre que o valor de / sobre a reta y = —x + 3 é constante, isto
é, que y = —x + 3 é uma curva de nível de / .
(e) Se, por um momento, / representasse um lucro, sob qual reta você
gostaria de estar: y = —x + 2 o \ i y = —x + 3? Justifique sua
resposta.
[11] Considere a função 2: = f{x^y) = ^y{x — y)/{x + y). Determine geo­
metricamente o domínio de f e faça um esboço das curvas de nível da
função.
*[12] Considere a função 2: = g{x^y) = —1 )/(x —y). Determine
geometricamente o domínio de p e faça um esboço das curvas de nível
da função.
*[13] Considere a função z = h{x^y) = sen(x —y). Determine geometrica­
mente o domínio de h e faça um esboço das curvas de nível da função.

Até agora, utilizamos os planos x = k^y = k e z = k^ com k uma constante,


para nos ajudar a fazer o esboço do gráfico de uma função de duas variáveis.
A mesma técnica pode ser aplicada para nos ajudar a fazer 0 esboço de uma
superfície de nível de uma função de três variáveis.

[14] (O plano) Resolva as questões abaixo.


(a) Considere a função

w = f{x, y,z) = 2 x + 3 y + Az.

Utilize os planos x = k ^ y = k e z = k para fazer um esboço da


superfície de nível de / associada aos níveis w = + 1 2 ^ w = 0 e
w = -12.
3.6 Exercícios 107

(b) Considere a função


w - f { x , y , z ) = 2 x + 3y.
Utilize os planos x = k, y = k e z = k para fazer um esboço da
superfície de nível de / associada aos níveis w = + 1 2 , w = 0 e
w = —12.
(c) Considere a função
w = f { x , y , z ) = 2 x.
Utilize os planos x = k, y = k e z = k para fazer um esboço da
superfície de nível de / associada aos níveis w = + 1 2 , w = 0 e
w = -12.
(d) Mais geralmente, considere a função

w = f { x , y, z ) = ax + bx + cx,

onde a, b e c são constantes não simultaneamente nulas, isto é, a, b


e c são constantes tais que a^ + b^ + c^ ^ 0. Utilize os planos x = k,
y z= k e z = k para fazer um esboço da superfície de nível de /
associada ao nível w = d nos casos abaixo.
(1) a 7^ 0, 6 7^ 0, c 7^ 0 e d 7^ 0.
(2) aT^O, 67^0, C 7 ^ 0 e d = 0.
(3) UT^O, 67^0, c = 0ed7^0.
(4) a 7^ 0, 67^ 0, c = 0 e d = 0.
(5) a 7^ 0, 6= 0, c = 0 e d 7^ 0.
(6) a 7^ 0, 6= 0, c = 0 e d = 0.
O conjunto de pontos que satisfazem a equação a x + 6 + c;2: = d
(a superfície de nível w = d de f ) é um plano. Compare com a
equação (2.16) da página 70.
[15] (O elipsóide) Resolva as questões abaixo.
(a) Considere a função
x"^ 'iP' 2}

Utilize os planos x = k, y = k e z = k para fazer um esboço da


superfície de nível de / associada ao nível w = 1 .
108 Funções escalares com várias variáveis

(b) Mais geralmente, considere a função

u; = /(x,2/,z) = ^ + ^ + ^ ,

onde a^b e c são constantes positivas. Utilize os planos x = y = k


e z = k para fazer um esboço da superfície de nível de / associada
ao nível w = 1 . Observe que os pontos desta superfície satisfazem
a equação
2/^ ^2;^ 1 / X
^ + jí+ ^ = i' (•« )
(c) O que acontece com o desenho da superfície de nível w = 1 quando
a = 6? E quando b = c? E quando a = b = c?
(d) O que você pode dizer sobre as superfícies de nível de / para outros
níveis?
O conjunto de pontos que satisfazem a equação (***) (a superfície de
nível = 1 de /) recebe o nome de elipsóide.
[16] Por que você acha que o conjunto de pontos que satisfazem a equação
jc? = 1 do exercício anterior recebe o nome de
elipsóide?
[17] (O c o n e, o h ip e r b o ló id e e líp tic o d e u m a e d u as folh as) Considere
a função
w = /(a;, y, 2) = .

(a) Utilize os planos x = k ^ y = k e z = k para fazer um esboço da


superfície de nível de / associada ao nível w = —1 . Observe que os
pontos desta superfície satisfazem a equação

- X —y + z = 1 .

Esta superfície de nível é denominada hiperbolóide elíptico de duas


folhas.
(b) Utilize os planos x = k, y = k e z = k para fazer um esboço da
superfície de nível de / associada ao nível w = 0. Observe que os
pontos desta superfície satisfazem a equação

+ y^.

Esta superfície de nível é denominada cone.


3.6 Exercícios 109

(c) Utilize os planos x = k, y = k e z = k para fazer um esboço da


superfície de nível de / associada ao nível w = 1 . Observe que os
pontos desta superfície satisfazem a equação

+ y^ - = 1.

Esta superfície de nível é denominada hiperholóide elíptico de uma


folha.

Por que você acha que estas superfícies de nível foram batizadas com
estes nomes?

[18] (S u p e r fíc ie s cilín d ricas) Utilize os planos x = k , y = k e z = k para


fazer um esboço da superfície de nível de cada uma das funções abaixo /
associada ao nível u; = 0.

(a) w = f{x, y, z) = x ‘^ + y‘^ - 1.


(b) w = f { x , y , z ) = x^ - y .
^ + 2 - z.
(c) w = f{x, y,z) = x “
(d) w = f { x , y , z ) = |yl - 2;.

Todas estas superfícies de nível têm algo em comum: apesar de / de­


pender de três variáveis, apenas duas aparecem na expressão algébrica
que define / . Mais especificamente, temos

/:
{x,y,z) i-> w = f { x , y , z ) = g{x,y) ’

onde

9- —y .

para o caso onde é a variável “z” que está faltando na definição de / .


Como você deve ter percebido, para desenhar uma superfície de nível
w = k de uma função deste tipo, basta desenhar a curva de nível
g{x,y) = k de g no plano xy e então, sobre cada ponto desta curva,
desenhar uma reta perpendicular ao plano xy (veja a figura (3.19)). Os
casos onde a variável “x” ou a variável “y” estão faltando são trata­
dos de maneira análoga. Estas superfícies de nível são denominadas
superfícies cilíndricas.
110 Funções escalares com várias variáveis

Figura 3.19: Uma superfície cilíndrica.

[19] (Superfícies de revolução) Utilize os planos x = k, y = k e z = k


para fazer um esboço da superfície de nível de cada uma das funções
abaixo / associada ao nível w = 0.
(a) w - f {x, y, z) = x'^ + y^ - z^.
(b) w = f {x, y, z) = x^ + y^ -
(c) w = /(x , y, z) = x^ + y"^ - (cos(z) + 2)^.
(d) w = / ( x , y, z) = x^ + 2/2 - 1 .

Todas estas superfícies de nível têm algo em comum: os cortes z = k


são circunferências com centro no eixo z\ Mais especificamente, se

/:
(x,y,z) I-)- w = f { x , y , z ) = x^ + y ^ - { g { z ) ) ’

onde

g:K ^K ^

é uma função não-negativa, então a interseção da superfície de nível


f {xjy, z) = 0 de f com o plano z = k é uma circunferência de centro
em (0,0, k) e raio g{k) (veja a figura (3.20)). Estas superfícies de nível
são denominadas superfícies de revolução. Geometricamente, o desenho
3.6 Exercícios 111

de uma superfície de revolução pode ser obtido através da rotação de


uma curva plana (a curva geratriz da superfície) em torno de um eixo
(o eixo de revolução da superfície) que, em nosso caso, é o eixo >2:.

Figura 3.20: Uma superfície de revolução.

Evidentemente, as superfícies de nível ií; = 0 de funções do tipo

w = f{x, y, z) = x^ + z‘^ ~ (5(2/))^ 6 10 = /(x , y, z) = y^ + z^ - {g{x)f

também são superfícies de revolução, com eixos de revolução dados,


respectivamente, pelos eixos y e x. De fato, podemos generalizar um
pouco mais: as superfícies de nível w = 0 de funções do tipo
W = f{x, y, z) = h(x^ + y^,z),w = f{x, y, z) = /i(x^ + y) e
w = f{x, y, z) = h{y‘^ + z^, x),
com h: M., também podem ser descritas como a rotação de uma
curva plana em torno de um eixo de revolução. Para ver como esta
generalização funciona, faça um esboço da superfície de nível u; = 0 da
função w = f{x, y^z) = z — ln{x‘^ + y^).
112 Funções escalares com várias variáveis

[20] Utilize os planos x = k , y = k e z = k para fazer um esboço da superfície


de nível de cada uma das funções abaixo / associada ao nível u; = 0.

(a) w = f{x, y,z) = z - {x - i f - {y - 1)^.


(b) w = f{x, y,z) = z - {x + V f - (y - 1)^
(c) w = f{x, y,z) = z - {x - i f + { y - 1)^
(d) w = f{x, y,z) = z - {x + 1)2 + { y - 1)^.
[21] O desenho de uma esfera de centro em (0, 0, 0) e raio 1 pode ser o gráfico
de alguma função z = f{x^ y) de duas variáveis? Justifique sua resposta.
[22] Resolva as questões abaixo.

(a) Considere a função w = f{x) = Determine as curvas de nível


de f e faça um esboço de seu gráfico.
(b) Considere a função w = g{x^y) = x"^. Determine as superfícies de
nível de 5 e faça um esboço de seu gráfico.
(c) Considere a função w = /i(x, y, z) = x^. Determine as hiperfícies de
nível de h.
(d) Suponha que você chegue em uma sala de aula onde a única sentença
escrita no quadro é: ^Taça um esboço do gráfico da função w = x^^P\
Que desenho você faria?
[23] Resolva as questões abaixo.
(a) Faça o gráfico da função y = /(x ) = x^. Escreva uma função
F: -> R cuja curva de nível associada ao nível 0 seja igual ao
gráfico de / .
(b) Mais geralmente, dada uma função / : R —)►R, escreva uma função
F : R^ -> R cuja curva de nível associada ao nível 0 seja igual ao
gráfico de / . O que você pode dizer a respeito das curvas de nível
de F para níveis diferentes de 0?
(c) Seja z = f{x^y) = x^ + j/^. Escreva uma função F : R^ R cuja
superfície de nível associada ao nível 0 seja igual ao gráfico de / .
(d) Mais geralmente, dada uma função / : R^ —)►R, escreva uma função
F : R^ R cuja superfície de nível associada ao nível 0 seja igual
ao gráfico de / . O que você pode dizer a respeito das superfícies de
nível de F para níveis diferentes de 0?
3.6 Exercícios 113

[24] Na figura (3.21) temos, respectivamente, o desenho das curvas de nível


de seis funções diferentes:
5
(a) z = fi{x, y) = sen{xy)/{xy),
(b) 2 = h { x , y ) =
(c) ^ = fz{x, y) = 15 + 2/^),
(d) 2 = fi{x, y) = {xy^ - x^y)/ 2 ,
(e) 2 = Í 5Íx,y) = sen{^/x^ + y'^),
(f) z = feix,y) = (í/ '* - 8 í/ 2 - 4 x2)/21.
Faça a associação destas curvas de nível com cada um dos gráficos na
figura (3.22).
[25] As superfícies de nível da função w = /{x^y^z) = z —x ‘^ —y‘^ associadas
aos níveis w = —2, w = 0 e w = 2 (veja a figura (3.18)) podem se
interceptar? Justifique sua resposta!
[26] Utilize um programa de computador para fazer os gráficos das seguintes S
funções de duas variáveis:
(a) 2 = f{x, y) = x ‘^ ~ (Sela de cavalo)
(b) z = /(x , y) = x ^ - 3 xy^. (Sela de macaco)
(c) z = /(x , y) = Ax^y - 4 xy^. (Sela de cachorro)
Consulte a página http://www.mat.puc-rio.br/cursos/MAT1152/ para
uma lista de programas disponíveis. Tente também visualizar as curvas
de nível destas funções.

Seja / : í) C R uma função de n variáveis definida no domínio D.


Dizemos que um ponto x* = (x^, X2, . . . , x*) G D é um ponto de máximo
global de / se /(x ) < /(x*) para todo x = (xi, X2, . . . , Xn) E D (isto é, /
assume seu maior valor no ponto x*). Analogamente, dizemos que um ponto
X* G D é um ponto de mínimo global de / se /(x ) > /(x*) para todo x G D
(isto é, / assume seu menor valor no ponto x*). Um extremo global é um
ponto de máximo global ou um ponto de mínimo global.

[27] Mostre que (0, 0) é um ponto de mínimo global da função


y) = x^ + 2/^
estudada no exemplo (3.1).
114 Funções escalares com várias variáveis

(f)

Figura 3.21: Curvas de nível de seis funções diferentes.


3.6 Exercícios 115

(5) (6)
Figura 3.22: Gráfico de seis funções diferentes.
116 Funções escalares com várias variáveis

[28] Mostre que (0, 0) não é nem um ponto de máximo global e nem um
ponto de mínimo global da função z = f{x^y) = estudada no
exemplo (3.2).
[29] Mostre que a função ^ = /(x , y) = In —1), estudada no exercício
resolvido (3.1), não possui extremos globais.
[30] Encontre os extremos globais (caso existam) da função
w = f{x, y, z) - -v/9 - _ ^2

estudada no exemplo (3.3).


[31] Mostre que a função w = /(x ,y ,z ) = 2: — estudada no exem­
plo (3.4), não possui extremos globais.
[32] Considere a função de duas variáveis
f: D M
{x,y) H4- z = f {x, y) = x^ + y"^
definida em um subconjunto D de ] K Faça um esboço do gráfico de /
em cada um dos três casos abaixo.
(a) D = {(x, y) G \ + y‘^ < !}•
(b) D = {( x, y) GM^| - l < x < + l e - l < y < +1}.
(c) D = {(x, y) G I x ^ 4 + yV9 < !}•
[33] A diferença de potencial E entre duas soluções eletrólitas separadas por
uma membrana é dada por
R^T x-y
E = • In;
F x+y
onde R ^ T e F são constantes que representam, respectivamente, a cons­
tante universal dos gases, a temperatura absoluta e a unidade Faraday.
As variáveis x e y representam as mobilidades de Na"^ e Cl” , respec­
tivamente. A variável z representa a razão ci/c2, onde ci e c<i são as
concentrações média de sal (NaCl) em cada lado da membrana. Assuma
que R • T j F = 25.
(a) Escreva a superfície de nível = —12 na forma z = f{x^y).
(b) Na prática, y = 3x/2. Faça esta substituição, simplifique e esboce
o gráfico da função (de uma variável) resultante.
3.6 Exercícios 117

[34] Uma chapa plana de metal está situada no plano xy de modo que a
temperatura T (em °C) no ponto (x,y) é inversamente proporcional à
distância da origem (0,0).
(a) Descreva as isotérmicas^ isto é, as curvas de nível de T que repre­
sentam pontos onde a temperatura é constante.
(b) Se a temperatura no ponto (4, 3) é 40°C, ache a equação da isotér­
mica para uma temperatura de 20°C.
[35] O potencial elétrico V no ponto {x^y^z) é dado por
V = 6/ + 4j/^ -h
(a) Descreva as superfícies eqüipotenciais^ isto é, as superfícies de nível
de V que representam pontos onde o potencial elétrico é constante.

(b) Ache a equação da superfície eqüipotencial V = 120.


[36] De acordo com a lei de gravitação universal de Newton, se uma partícula
de massa mo está na origem (0,0,0) de um sistema de coordenadas xyz^
então o módulo F da força exercida sobre uma partícula de massa m
situada no ponto (x, y, z) é dada por
mp-rn
x2 + y2 + ^2^
onde G é a constante de gravitação universal. F depende de quantas
variáveis? Se mp = 1.9910^^ kg e m = 5.9810^"^ kg, descreva as su­
perfícies de nível da função resultante. Qual é o significado físico dessas
superfícies de nível? .
[37] A fronteira superior da região semicircular da figura abaixo
118 Funções escalares com várias variáveis

é mantida à temperatura de 10°C, enquanto a fronteira inferior é man­


tida em 0°C. A temperatura de estado estacionário T em um ponto
[x^y) interior à região é dada por

T (x, y) = ^ • arctg ( -----


7T \1 — —
Mostre que as isotérmicas são arcos de círculos com centros no eixo y
negativo e que passam pelos pontos (—1,0) e (1,0). Esboce a isotérmica
correspondente à temperatura de 5°C.

[38] De acordo com a lei dos gases ideais^ a pressão P, o volume y e a


temperatura T de um gás confinado estão relacionados pela equação

P • y = A: • T,

para uma constante k. Expresse P como função de y e T e descreva


as curvas de nível associadas a esta função. Qual é o significado físico
dessas curvas de nível?

[39] A força P gerada por um rotor eólico é proporcional ao produto da


área A varrida pelas pás do rotor e à terceira potência da velocidade v
do vento.

(a) Expresse P em função de A e v.


(b) Descreva as curvas de nível de P e explique seu significado físico.
(c) Quando o diâmetro da área circular varrida pelas pás é 2 metros e
a velocidade do vento é 30 km/h, então P = 3000 watts. Ache a
equação da curva de nível P = 4000 watts.

[40] Se a; é a velocidade do vento (em m/s) e ?/ é a temperatura (em °C),


então 0 fator de resfriamento eólico F (em (kcal/m^)/h) é dado por

P = (33 - j/) • (10^/í - X + 10.5).

(a) Ache as velocidades e temperatura para os quais F é zero (admita


que 0 < X < 50 e —50 < y < 50).
(b) Se P > 1400, pode ocorrer congelamento em partes expostas do
corpo humano. Esboce o desenho da curva de nível P = 1400.
3.6 Exercícios 119

[41] A pressão atmosférica nas proximidades do solo em uma certa região é


dada por
p{x,y) = a • + ò • + c,
com a, 6 e c constantes positivas. Descreva as isobáricas (curvas de nível
de p) para pressões superiores a c.
[42] (O toro) Resolva as questões abaixo.
(a) Considere a função
^ + y‘^ + + 5^ - - 4 (5)^ {x^ + j/^).
Utilize os planos z = k ^ y — = Q para fazer um esboço da
superfície de nível de / associada ao nível tü = 0.
(b) Mais geralmente, considere a função
w = f{x, y, z) = (x^ + - r^f - 4 (x^ + y^),
onde R e r são constantes positivas com R > r. Utilize os planos
x = A:,y = 0 e z = 0 para concluir que a superfície de nível de /
associada ao nível u; = 0 tem o formato de uma câmara de ar de
um pneu de automóvel, conforme indicado na figura abaixo. Esta
superfície recebe o nome de toro.
Capítulo 4

Continuidade, noções de topologia e o


teorema de Weierstrass

No capítulo anterior estudamos o conceito de função de várias variáveis,


que é o objeto matemático por excelência para se modelar problemas. Vi­
mos também as diversas maneiras de representá-lo geometricamente: seja
através de seu gráfico ou seja através de suas hiperfícies de nível. Com estes
recursos geométricos vamos estudar uma primeira propriedade interessante
que funções podem ter: continuidade.

4.1 Por que funções contínuas são im portantes?

O conceito de continuidade não deve ser novo para você pois você já deve
tê-lo estudado em Cálculo I. De qualquer modo, vamos fazer uma revisão do
assunto.
Sejam / : í? C M R uma função de uma variável e p e D um ponto
do domínio D de f . A função / associa p no domínio a f{p) na imagem.
Considere agora x e D uma aproximação de p. O que podemos dizer a
respeito de f{x) {o valor de f na aproximação) e f{p) {o valor de f no
ponto)? Para uma função contínua é possível “amarrar” estes quatro valores:
se f é contínua em p, então f{x) pode ser considerado uma aproximação de
/(p), tão boa quanto se queira, desde que x esteja suficientemente próximo
de p. Em outras palavras, para garantir que f{x) esteja suficientemente
próximo de /(p ) (na imagem) basta tomar x suficientemente próximo de p
(no domínio).
Como formalizar matematicamente este conceito? Através de seqüências
122 Continuidade, noções de topologia e o teorema de Weierstrass

numéricas: construir aproximações de p é construir seqüências Xn que con­


vergem para p e, para funções contínuas em p, espera-se que f{xn) convirja
para /(p) (veja figura (4.1)). Mais formalmente:

D efinição 4,1 (CoNTiNuroADE) Seja / : D C R K. Dizemos que


/ é contínua em um ponto p de seu domínio D se para toda seqixência

no domínio, tem-se

f { x n) f{p)

na imagem. Se / não é contínua e m p € D, então dizemos que / é


descontínua em p. Se / é contínua em'todos os pontos de seu domínio,
então dizemos simplesmente que / é contínua.

Figura 4.1: Ilustração do conceito de continuidade em 1 variável através do gráfico de / .

Mas por que funções contínuas, isto é, funções que satisfazem a definição
acima, são importantes? Vamos citar duas propriedades de interesse.
Propriedade 1:
O valor de uma função contínua em um ponto p é ‘‘estável” por pequenas
variações em p. Para exemplificar, considere a seguinte situação: você está
modelando matematicamente um determinado fenômeno (digamos, o quanto
4.2 Continuidade em várias variáveis 123

uma ponte suspensa é resistente ao vento) e é necessário calcular a função /


resultante em pontos da forma 2 • • tt, com A; = 0, 1, . . . , 99. Se você está
utilizando um computador para fazer os cálculos, certamente você não conse­
guirá calcular a função exatamente nestes pontos pois, sendo o computador
uma máquina com precisão finita, ele não conseguirá representar o número
real tt que possui infinitas casas decimais não-periódicas. O melhor que se
consegue fazer é calcular a função / em aproximações destes pontos, diga­
mos, em 6.28-A: ou 6.2831 -A: (isto sem considerar os erros de arredondamento
efetuados durante os cálculos).
Você passaria por uma ponte suspensa que foi projetada utilizando apro­
ximações e não os valores originais? Se a função que descreve o fenômeno
é contínua, então você pode ficar mais tranqüilo pois você sabe que, para
pontos suficientemente próximos de 2 • A; • tt, o valor da função nestes pontos
estará tão próximo do valor correto /(2 • A;• tt) quanto se queira. Baista então
escolher uma tolerância e prosseguir com os cálculos.
Propriedade 2:
Nem todo problema de otimização possui uma solução, isto é, nem toda
função definida em um conjunto possui um máximo global ou um mínimo
global neste conjunto. Uma importante pergunta é: como saber, a priori^ se
um problema de otimização possui ou não uma solução? Um teorema que
resolve esta questão envolve o conceito de continuidade.

T eorem a 4*1 (W bjierstrass) Toda função / : [a,6] C M M


contínua definida no intervalo fechado e limitado [a, b] possui pelo me­
nos um máximo global e pelo menos um mínimo global em [a, 6].

Observe que o teorema exige duas coisas: (1) a continuidade da função / e,


(2), que ela esteja definida em um intervalo fechado e limitado da forma [a, b].
Se uma ou as duas destas condições não se verificarem, nada se pode garantir.
Faça algumas figuras e tente pensar em exemplos e contra-exemplos!

4.2 C ontinuidade em várias variáveis

A idéia é a mesma! Vamos começar com duas variáveis: considere uma


função / : D C R e (a, 6) um ponto do domínio D de f . A função
124 Continuidade, noções de topologia e o teorema de Weierstrass

associa (a, 6) no domínio a /(a , 6) na imagem. Considere agora {x,y) uma


aproximação de (a, 6), isto é, x é uma aproximação de a e j/ é uma apro­
ximação de h, O que podemos dizer a respeito de f{x^y) {o valor de f
calculado na aproximação) e /(a , 6) {o valor de f no ponto)? Como antes,
para uma função contínua em (a, 6), vale que f {x, y) pode ser considerado
uma aproximação de /(a , 6), tão boa quanto se queira, desde que (x, y) esteja
suficientemente próximo de (a, 6), isto é, desde que x esteja suficientemente
próximo de a e y esteja suficientemente próximo de 6 (veja a figura (4.2)).
A definição formal, como antes, faz o uso de seqüências.

/(Xl)
/w

.• • •
:# P \

/(p )

Figura 4.2: Ilustração do conceito de continuidade em 2 variáveis através do


dom ínio/contradom ínio de / .

D efinição 4 .2 (C ontinuidade ) Seja / : D c M. Dizemos


que f é continua em- um ponto p = (o, b) fie seu domínio D se para
íòda sequêncíaí

= “ {Xn, Vn) -t (n, &).- p


no domínio, isto é, se para todo par de sequências numéricas

com {xnx V n ) € D , tem-se


4.2 Continuidade em várias variáveis 125

f{Xn ,yn)^ f{a,b) , ,


na imagem. Se / nao é contínua em p é D, então dizemos que / é
descontínua em p. Se f é contínua em todos os pontos de seu domínio,
então dizemos simplesmente que / é contínua. Note que Zn —
é uma sequência de números reais!

Talvez a melhor maneira de entender como uma função contínua se parece é


visualizar o gráfico de uma função que não é contínua.

E xem plo 4.1 A função

2 se y > 0,
2; = f {x, y) =
1 se 2/

não é contínua em p = (0,0) pois a seqüência


1'
— (^^nj 2 /n ) — ( 0 ;
n
converge para p = (0,0) mas

/(Xn) = f{Xn, í/n) = / 0, - ) = 2


n
converge para 2, que é diferente de 1 = /(p ) (veja a figura (4.3)). Em
verdade, / é descontínua em todos os pontos da forma (a, 0) (o eixo x) e
contínua nos demais pontos. i

C U ID A D O ! C U ID A D O ! C U ID A D O !

Para mostrar que uma função é contínua em um ponto (a, ò), é pre­
ciso provar que para todas as seqüências (x^jj/n) que convergem para
(a, 6), tem-se f{xn,yn) convergente para f{a,b). Estabelecer a con­
vergência para uma ou duas seqüências particulares não é suficiente
para demonstrar a continuidade da função no ponto. No exemplo ante­
rior, a seqüência {xn^y-n) = (1/n, 0) converge para (0,0) e f{xn^yn) =
/( l /n ,0 ) = 1 converge para 1 = /(0 ,0 ) mas, mesmo assim, / é des­
contínua em (0, 0).
126 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.3: O gráfico de um a função descontínua.

Exercício resolvido 4.1 A função


a;2+^2 se (x,j/) 7^ (0,0),
f { x, y) = <
1/2 se (a;,y) = (0,0),
é contínua em (0, 0)?

Solução: Inicialmente, observe que


1 1
Vn) — ( 0, 0)
n n
1 1 1
nf \
f [X n , V n ) -
* Vn
2 ,
n n —ui —1
2 = /(0-0)-
'^n ' Un
-) + ( i
nJ \n
Contudo, isto não garante que / seja contínua em (0,0) pois pode existir
uma outra seqüência (s„, ?/„) que converge para (0,0) mas com /(x„, í/„) não
convergindo para 1 / 2 — f (0,0). De fato, tal seqüência existe pois

{xn,yn) = ( - > - ) -> (0,0)


\n n J
4.2 Continuidade em várias variáveis 127

1 2
* Un n_n _ ni _ 2
/ ( ^nj Vn ) — y \= m o ) .
4 + 2 \^ A
nj U /
Sendo assim, / não é contínua em (0, 0). Observe que os pontos da seqüência
(1/n, 1/n) (que converge para (0,0)) estão sobre a reta y — x e que os pontos
da seqüência (1/n, 2/n) (que também converge para (0, 0)) estão sobre a reta
y = 2 x. I

Vamos ver agora exemplos de como provar que funções são contínuas.

Exercício resolvido 4.2 Mostre que a função z = f{x^y) = x é contínua


no ponto (2,1).

S o l u ç ã o : Dada uma seqüência qualquer {xn^Vn) Que converge para (2,1),


devemos mostrar que /{xn^yn) converge para / ( 2 , 1) = 2. Como {xn^yn)
(2,1), sabemos que
Xn 2

e yn 1- Então,
/ {^n-i Vn ) — 2 — /(2, l ) .

Exercício resolvido 4.3 Mostre que a função 2: = f{x^y) = x é contínua.

S o l u ç ã o : Devemos mostrar que / é contínua em todos os pontos (a, 6)


de Seja então {xn^ Vn) uinst seqüência qualquer que converge para (a, 6).
Devemos mostrar que /(x^, yn) converge para /(a , 6). Como (a:„, y^) —^ (n, h)
segue-se que
Xn a
e yn ^ b. Portanto,

f{^n, 2/n) = a = /(u , 6).

A definição de continuidade se estende naturalmente para funções que


dependem de três ou mais variáveis:
128 Continuidade, noções de topologia e o teorema de Weierstrass

D efinição 4.3 (CONTINUIDADE) Seja / : D C R”* K- Dizemos


que / é contínua em um ponto p = (pi,P2, • • • ,Pm) de seu domínio D
se para toda sequência

“ (®1,W) • I ^m,n) (plrPSt • • • ^Ptr^ ’P


no domínio, isto é, para toda coleção de. m sequências numéricas

®l,r» Pu ®2,?i ~^P 2í ' ••> Pm,


com {xi^n, X2,n, ■■■, Xm,n) € D, tem-se

f{xn) ~ f{xí,n, ®2,n, • • •, ®7n,n) f(phP^> ■■■>Pm)- / ( p )


na imagem. Se / não é contínua em p € D, então dizemos que / é
descontínua em p Se f é contínua em todos os pontos de seu domínio,
então dizemos simplesmente que / é contínua. Pinalmente, observe
que Zn = / ( a : i , n , é uma sequência de números reais!

O teorema seguinte estabelece uma maneira fácil de se criar e de se identificar


funções contínuas a partir de outras funções contínuas.

T eorem a 4.2 Sejam / : D / G R”^ -)■ M e s»: Dg C M’” M funções


contínuas em p € D/ n Dg. Então

são contínuas em p. Se ^(p) ^ 0, então

é contínua em p. Mais ainda se h: Dh C é contínua em


/( p ) e Dh, então
hof

é contínua em p.

Demonstração: A demonstração deste teorema é uma aplicação direta de


um teorema análogo para seqüências que você já estudou em Cálculo I. Para
referência, vamos provar aqui que a soma de duas funções contínuas também
4.3 o teorema de Weierstrass no caso de n variáveis 129

é uma função contínua. Os demais casos {f — g, f • 9^ f / g ^ ^ o f ) são


demonstrados analogamente e vamos deixá-los como exercício.
Seja uma seqüência convergindo para p E D f f] Dg. Então, pela
continuidade de / e temos

/(Xn) -)■ /(p ) e g{xn) g{p).

Em Cálculo I você aprendeu que a soma de seqüências numéricas conver­


gentes converge para a soma de seus respectivos limites e, como /(x „) e
g{x.n) são seqüências numéricas (isto é, seqüências em R) que convergem
respectivamente para /(p ) e ^(q), segue-se que

( / + 5)(Xn) = /(x „) + g{Xn) /(p ) + g{p) = ( / + g){p).

Isto mostra que f + g é contínua em p. a

Com este teorema é possível justificar, por exemplo, a continuidade da função

f{x, y) = sen .

De fato: x e y são funções contínuas (veja o exercício resolvido (4.3) e o


exercício [01]). Logo, e são funções contínuas como produto de funções
contínuas. Conseqüentemente, é contínua como soma de funções
contínuas. Finalmente, como a função seno é contínua, segue-se que /(x , y) =
sen (x^ + y^) é contínua como composição de funções contínuas.

4.3 O teorem a de W eierstrass no caso de n variáveis

Como vimos na seção (4.1), funções contínuas de uma variável definidas


em um intervalo fechado e limitado [a, b] possuem pelo menos um máximo
global e pelo menos um mínimo global em [a, 6]. Uma pergunta natural é
se existe um resultado parecido para funções de duas ou mais variáveis. A
resposta é sim! E de se esperar que a continuidade da função ainda seja
exigida mas o que faria o papel de um intervalo fechado e limitado [a, 6] no
caso de n variáveis?
Para responder a esta pergunta, vamos estudar várias situações e tentar
intuir as propriedades que um conjunto admissível D deveria possuir a fim
130 Continuidade, noções de topologia e o teorema de Weierstrass

de que uma função contínua definida em D possua pelo menos um máximo


global e pelo menos um mínimo global em D.
Considere

/: Z) C R
{x, y) z = f{x, y) = x ‘^ + y‘^ ’

onde D pode ser um dos seis conjuntos abaixo.


(1) £) = R2,
(2) D = {(x,y) G + j/2 < 1},
(3) D = {(a;,j/) G + í/2 < 1},
(4) D = {(x,y) G —1 < X < +1 e - 1 < ?/ < +1},
(5) D = {{x,y) G 1 < x^ + e
(6) D = {{x,y) G 1 < x^ + < 4}.
Pergunta: em quais dos seis casos a função-objetivo / possui pelo menos um
máximo global e pelo menos um mínimo global no conjunto admissível Dl
Observe que estamos usando uma mesma expressão algébrica para a
função-objetivo / e mudando apenas o conjunto admissível D.
O desenho dos vários conjuntos admissíveis e respectivos gráficos de ^ =
f{x^y) = + 'ip' encontram-se nas figuras (4.4), (4.5), (4.6), (4.7), (4.8),
(4.9) e (4.10). Note que as figuras (4.5) e (4.9) representam apenas uma
parte do gráfico de / .
No caso (1), / possui um único ponto de mínimo global, (0, 0), mas / não
possui pontos de máximo global em D = R^. De fato, a partir dos cálculos
feitos no exemplo (3.1) da página 81, é fácil de ver que as curvas de nível (não-
vazias) de / são circunferências de centro na origem. Se nos aproximamos
de (0, 0), então o valor da função diminui e quando nos afastamos de (0, 0),
o valor da função aumenta (nos pontos da circunferência de centro em (0, 0)
e raio r, o valor da função é r^). Como o ponto mais próximo de (0,0) é o
próprio ponto (0,0), segue-se que (0, 0) é ponto de mínimo global de / em R^.
Por outro lado, como podemos obter pontos em D = R^ arbitrariamente
distantes de (0,0), isto é, pontos em D = para os quais o valor de / é
tão grande quanto se queira, concluímos que / não possui pontos de máximo
global em D =
4.3 O teorema de Weierstrass no caso de n variáveis 131

(5) (6)

F igura 4.4: Desenho de seis conjuntos admissíveis diferentes.


132 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.5: 0 gráfico de / definida em D =


4.3 o teorema de Weierstrass no caso de n variáveis 133

Figura 4.6: O gráfico de / definida em D = {{x^y) € \ x'^ + < 1}.


134 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.7: 0 gráfico de / definida em D = {{x^y) \ -\-y^ < 1 } .


4.3 o teorema de Weierstrass no caso de n variáveis 135

Figura 4.8: O gráfico de / definida em D = {{x,y) e \ - 1 < o; < +1 e —l < y < +1}.
136 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.9: 0 gráfico de / definida em Z) = {{x, y) |1< + y^}.


4.3 o teorema de Weierstrass no caso de n variáveis 137

Figura 4.10: O gráfico de / definida em H = {(x, j/) E | 1< + 2/^ < 4}.
138 Continuidade, noções de topologia e o teorema de Weierstrass

No caso (2), (0,0) é ainda o único ponto de mínimo global de / em


D = {(a:,2/)€R2 | x^ + 2/^ < 1}. Como não podemos tomar pontos arbitrari­
amente distantes de (0, 0), segue-se que / não assume valores arbitrariamente
grandes. De fato, os pontos de D mais distantes de (0, 0) são os pontos da
circunferência de centro em (0,0) e raio 1 sendo, portanto, os pontos de
máximo global de / em D = {(x, y) G \ + y^ ^ !}•
No caso (3), (0,0) é ainda o único ponto de mínimo global de / em
D = {{x^y) G 1 < 1}. Como no caso (2), não podemos tomar
pontos arbitrariamente distantes de (0,0) em D e, portanto, / não pode
assumir valores arbitrariamente grandes em D. Mas, agora, não existe um
ponto em D que seja considerado o ponto ‘‘mais distante” de (0,0). Dado
qualquer ponto em D, é sempre possível conseguir um outro ponto em D
ainda mais distante de (0, 0). Quanto mais nos aproximamos da “fronteira”
{(^7 y) C I x^-hy^ = 1}, mais o valor da função / aumenta, aproximando-
se cada vez mais do valor 1. Mas não existem pontos de D que realizem este
valor. Sendo assim, / não possui pontos de máximo global no conjunto
D = {(x, y) eM? I -f y^ < 1}.
No caso (4), (0, 0) é o único ponto de mínimo global de / no quadrado
D = —l < a ; < + l e —l < y < +1}. Por outro lado, os
pontos (—1 ,-1 ), (—1,-hl), (+ 1 ,-1 ) e (+1,+1) são os pontos de máximo
global de / em D. Justifique!
No caso (5), os pontos da circunferência de centro em (0,0) e raio 1 são
os pontos de mínimo global de / em D = {(x, y) G | 1< + y^}. Não
existem pontos de máximo global de / em D. Justifique!
No caso (6), / não possui pontos de mínimo global e nem pontos de
máximo global em D = {(x, y) G | 1 < x^ -h y^ < 4}. Justifique!
A fim de garantirmos a existência de máximos e mínimos globais, além
da continuidade da função-objetivo, estes exemplos sugerem que o conjunto
admissível D também deve ter certas propriedades especiais:

• D deve ser limitado^ isto é, D não pode possuir pontos arbitrariamente


distantes da origem (veja os casos (1) e (5)) e
• D deve conter seus pontos de ^fronteira^^ (veja os casos (3) e (6)).

Surpreendentemente, estas duas propriedades (junto com a continuidade da


função-objetivo) são suficientes para se estabelecer a existência de máximos
4.3 o teorema de Weierstrass no caso de n variáveis 139

e mínimos globais.
Para se formalizar estas propriedades (e estabelecer outras de interesse),
vamos precisar de alguns conceitos topológicos: distância euclidiana, bola
aberta, bola fechada, ponto interior, conjunto aberto, ponto de fronteira,
conjunto fechado, conjunto limitado e conjunto compacto.

D istân cia euclidiana

Definição 4.4 (DISTÂNCIA euclidiana em M”) N o plano R^, a


d is tâ n c ia e u clid ia n a entre dois pontos (o, b) e (x , y ) pode ser calculada
pelo teorema de Pitágoras çue fornece o tamanho do segmento de reta
que une os dois pontos.

d{{x, y), (a, 6)) = ^/{x-a )^ + { y - b f .


No espaço euclidiano tridimensional M®, ainde, com o auxílio do famoso
teorema, podemos encontrar a distância euckdiana entre dois pontos
(a,b,c) e (íc,y,;?) -calculando-se o tamanho do segmento de reta que
iine os dois pontos:

d{{x, y, z), (a, b,c))= y ^ { x - a f + { y - b f + { z - c)2.


Mais geralmente, no espaço euclidiano R”, a distância euclidiana entre
dois pontos p = (pi,P 2 j • ■• jprt) e X = (®i, a;^,. . . , Xn) é calculada por:

d(x, p) = \ / [xi -P i)2 + ... + { x n - Pnf x E ( ■PiY


N

Vamos ver alguns exemplos.

(a) A distância entre os pontos (1,2) e (3,4) é y/{3 — 1)^ + (4 —2)^ = \/8.
(b) A distância entre os vértices (0, 0) e (1,1) do quadrado Q 2 = [0,1] x [0,1]
é V ( l - 0 ) ) 2 + ( l - 0 ) ) 2 = V2.
(c) A distância entre os vértices (0 ,0 ,..., 0) e ( 1 ,1 ,..., 1) do cubo n-dimen-
sional Qn = [0,1] x [0,1] x • • • x [0,1] é ^/n.
140 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.11: Distância euclidiana entre dois pontos de

Figura 4.12; Distância euclidiana entre dois pontos de M^.


4.3 o teorema de Weierstrass no caso de n variáveis 141

O próximo teorema estabelece algumas propriedades da distância euclidiana.

T eo rem a 4.3 (P ropriedades da função distância ) Considere


p, q e r pontos em K". Então

( 1 ) d ( p , q ) > 0 e d ( p ,p ) = 0,

(2 ) d (p ,q ) = d (q ,p ) e

(3) {Desigualdade triangular) d(p,<j) < d(p,i*) + d(r, q),

onde d(p>q) é a distância euclidiana entre os pontos p e q.

A primeira propriedade diz que a distância entre dois pontos é sempre


> 0 e que a distância de um ponto p até ele mesmo é zero, a segunda
propriedade afirma que a distância de p até q é igual à distância de q até
p e, finalmente, a terceira propriedade (a desigualdade triangular) afirma
que dado um triângulo de vértices p, q e r, a medida de um dos seus lados
(d(p,q)) é sempre menor ou igual que à soma das medidas dos outros dois
lados (d(p,r) + d(r),q)).

Figura 4.13: A desigualdade triangular: d(p, q) < d(p, r) + d(r, q).

As propriedades (1) e (2) são fáceis de se demonstrar. No exercício [25]


indicamos como obter a desigualdade triangular (propriedade (3)) a partir
da desigualdade de Cauchy-Schwarz.
142 Continuidade, noções de topologia e o teorema de Weierstrass

Bola aberta

Agora que sabemos como medir distâncias em uma pergunta muito


natural que se põe é: dado um ponto p em R” , quais são todos os pontos
X em R” que estão a uma distância menor do que um número r (fixo) com
relação a p? No caso do plano (n = 2 ), temos

d (p ,x ) d{{pi,p 2), {xi,X2)) < r ^


\/(x i - P l ) 2 + (12 -P2)^ < r (Xi - pif + (X2 - P 2 f < r^,

isto é, um ponto x = {xi,X2) está a uma distância menor do que r com


relação a p = (p i,p 2) se, e somente se, x está no disco sem “casca’’

{ (x i, X 2) I ( X i - P i ) ^ + (X2 - P 2f < r ^ } ,

de centro em p e raio r. Não é difícil de ver que no caso tridimensional


(n = 3), um ponto x = (a;i, X2, X3) está a uma distância menor do que r com
relação a p = (pi,P 2,P 3) se, e somente se, x está na bola aberta

{(xi, X2, xz) e I (xi - P i f + (X2 - Pz)^ + (X3 - p z f < ,

de centro em p e raio r. Isto motiva a definição de uma bola aberta n-


dimensional:

Definição 4.5 (B ola ABERt Á) A hola aberta de centro em p =


(pi,;.. . , p„) € E” de raio r > 0 é o conjunto

-Sr(p) = { ( x i , . ., x„) € E ” I (x i - Pi)^ + ■ ••+ (x„ - P n f <

formado por todos os pontos de R”, cuja distância até p é menor do

Bola fechada

Analogamente, podemos nos perguntar quais são todos os pontos x em


R” que estão a uma distância menor ou igual a um número r (fixo) com
relação a um ponto p G R^ dado. Não é difícil ver que a resposta é uma
bola aberta com sua “casca”: a bola fechada.
4.3 o teorema de Weierstrass no caso de n variáveis 143

D é fin ^ â o . 4.6 (B ola fbohada) A bola fechada de centro em p =


(Pi, . , Pti) € 5^ d è r a io r > Ó é o conjunto

; Br{p) = { (íCi,. . . , aí„) € E” I (ari - p i f + • • • + (ain - Pn)^ < r “^}

formado por todos os pontos de cuja distância até p é menor ou


|||||i |j |^ ■ j |l ||||||H ||||^ |^ ^ ^ ^ ^

Conjunto lim itado

Com o conceito de bola fechada, podemos definir o que é um conjunto


limitado:

D e fin iç ã o 4 .7 (C onjunto limitado) Um subconjunto D de R^ é


dito ser lirmtado se existe uma bola fechada Br(0) de centro em 0 =
(0, , 0) 6 raio r tal que D C J5^(0).

Em outras palavras, um subconjunto í? de é limitado se é possível colocá-


lo dentro de alguma bola fechada de centro na origem 0 = (0, 0 ,..., 0).

Considere os exemplos a seguir.

(a) Os conjuntos dos casos (2), (3), (4) e (6) da página 130 são limitados.
Os demais conjuntos não são limitados.
(b) O quadrado Q 2 = [0,1] x [0,1] é um subconjunto limitado de R^ pois
ele está contido na bola fechada 5 ^ (0 ,0 ) de centro em (0,0) e raio \/2.
Mais geralmente, o cubo n-dimensional Qn = [0,1] x [0,1] x • • • [0,1] é
um subconjunto limitado de R^ pois ele está contido na bola fechada
S ^ ( 0 , 0 ,..., 0) de centro em (0 ,0 ,..., 0) e raio ^/n.
(c) O semiplano superior |(x ,y ) G R^ I 2/ ^ O} não é um subconjunto limi­
tado de R^ pois não é possível colocá-lo em nenhuma bola fechada.

Ponto de fronteira

Vamos agora tornar mais formal a noção de “fronteira” , um conceito que


guiou nossa intuição na discussão sobre a existência de extremos globais de
144 Continuidade, noções de topologia e o teorema de Weierstrass

uma função contínua. Intuitivamente falando, um ponto p está na fronteira


de um conjunto D se é possível aproximá-lo por pontos que estão em D e
por pontos que não estão em D. Mais formalmente,

D efinição 4.8 (F eokt EIRa DE UM CONJUNTO) Um ponto p é ponto


de fronteira de um. conjunto D se toda bola aberta com centro p contém
pontos que estão em D e pontos que nab estão em D A fronteira de D
é 0 conjunto formado por todos os pontos de fronteira de D,

Por exemplo, qualquer ponto da circunferência


5^ = {(a;,i/) € \ x^ + = í]
é um ponto da fronteira da bola aberta B i(0 ,0). Observe que um ponto da
fronteira de um conjunto não precisa estar no conjunto! Com relação aos
conjuntos definidos na página 130, temos o que se segue.

(1) D = W‘ não possui pontos de fronteira.


(2) Os pontos de fronteira de + y^ < 1} são os
pontos do círculo {(x, ?/) G | = 1}.
(3) Os pontos de fronteira de D = {{x,y) E x^ + y^ < 1} são os
pontos do círculo {(x, y) 6 + y^ = 1}.
(4) Os pontos de fronteira de

D = {(x, y )€ lK ^ | —l < x < + l e —l < y < +1}

são os pontos do conjunto

({+1} X [-1, +1]) U ({-1} X [-1, +1]) U


([-1, +1] X {-1}) U ([-1, +1] X {+1}),
isto é, os pontos dos quatro lados de D.
(5) Os pontos de fronteira de Z? = {(x,y) G | 1 < x^ + y^} são os
pontos do círculo {(x, y) G [ x^ + y^ = 1}.
(6) Os pontos de fronteira de H = {(x, y) G | 1 < x^ + y^ < 4}
são os pontos do círculo {(x,y) G R^ | x^ + y^ = 1} e do círculo
{(x, y) G R^ I x^ + y^ = 4}.
4.3 O teorema de Weierstrass no caso de n variáveis 145

Conjunto fechado

O conceito que vamos definir agora — o de conjunto fechado — possui


um papel fundamental na geometria e análise dos espaços euclidianos.

D e fin iç ã o 4 .9 (C onjunto fechado ) Um subconjunto D de K" é


dito ser fechado em M" se todos os pontos de fronteira de D pertencem

Considere os exemplos a seguir.

(a) Os conjuntos dos casos ( 1 ), (2 ), (4) e (5) da página 130 são fechados. Os
demais conjuntos não são fechados.

(b) A bola fechada Br(p) é um subconjunto fechado em M".

(c) O quadrado Q 2 = [0, 1 ] x [0, 1 ] é um subconjunto fechado em R^. Mais


geralmente, o cubo n-dimensional Qn = [0, 1 ] x [0, 1 ] x • • • [0, 1 ] é um
subconjunto fechado em R".
(d) O semiplano superior {{x, y) | J/ > 0} é um subconjunto fechado
emR2.
(e) A bola aberta B i( 0 , 0) = {{x, y) € R^ | < l } (note a desigual­
dade estrita) de centro em (0, 0) e raio 1 não é um subconjunto fechado
em R^, pois os pontos de fronteira de B i( 0, 0) (isto é, os pontos (x,y)
em R^ tais que x'^ + y'^ = 1 ) não pertencem a B i( 0, 0).

( f ) A bola “furada” X = { (x, y) € R^ | 0 < x^ -f < l } de centro em (0, 0)


e raio 1 não é um subconjunto fechado em R^, pois (0, 0) é um ponto
de fronteira de X que não pertence a X . Observe, contudo, que existem
pontos de fronteira de X que pertencem a X .

A próxima proposição estabelece uma outra caracterização de conjuntos


fechados: se p é um ponto qualquer e se existem pontos em um conjunto
fechado D arbitrariamente próximos de p, então p também deve estar em D.

P r o p o siç ã o 4.1 Um subconjunto £> de R" é fechado em R" se, e


somente se, toda seqiiência convergente de pontos Xn em D tem seu
limite também em D , isto é, se x„ € D é uma seqüência tal que
x« -4 p, então p € D .
146 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.14: D é fechado, x„ e D e ^ p, logo, p GI).


Existe uma maneira muito simples de se identificar conjuntos fechados:

Proposição 4 .2 Se h \ R” R é con tínu a, então o conjunto

é fechado em R”, onde c é uma constante real.

A demonstração segue-se facilmente da proposição (4.1) e será deixada como


exercício (veja o exercício [1 1 ] no final do capítulo).

Conjunto compacto

Podemos definir agora o objeto em R” “equivalente” a um intervalo fe­


chado e limitado [a, 6] na reta R:

D efinição 4.10 (C onjunto compacto ) Um subconjunto K de R*^


é dito ser co m p a cto se'ele é h m tía d o e fech ado em R^.

Assim, a bola fechada B i( 0 , 0) e o quadrado Q 2 são exemplos de conjuntos


compactos. A bola aberta P i ( 0 ,0) não é compacta porque ela não é fechada
(apesar de ser limitada). O semiplano superior {(x ,y ) € R^ I 2/ > O} não é
compacto porque ele não é limitado (apesar de ser fechado).
Os conjuntos dos casos ( 2 ) e (4) da página 130 são compactos. Os demais
conjuntos não são compactos.
4.3 o teorema de Weierstrass no caso de n variáveis 147

O te o r e m a d e W eierstra ss

Com tudo isto, podemos finalmente enunciar o teorema de Weierstrass no


caso de funções que dependam de n variáveis:

T eorem a 4.4 ( W e i e r s t r a s s ) Toda função f ; K c R" R ,


contínua definida no conjunto compacto K (nãò-vãzio) possui pelo me­
nos um máximo global e pelo menos um mínimo global em K

Como vimos, os conjuntos dos casos (2) e (4) da página 130 são compactos
e uma vez que z = f{x^y) = + y^ é uma função contínua, podemos usar
o teorema de Weierstrass para garantir a existência de máximos e mínimos
globais de / nestes conjuntos.

C U ID A D O ! C U ID A D O ! C U ID A D O !

O teorema de Weierstrass diz que uma função contínua f definida em um


conjunto compacto K não-vazio possui pelo menos um máximo global e
pelo menos um mínimo global em K . E se / não for contínua ou K não
for compacto? Nesta situação, o teorema de Weierstrass não se aplica: /
pode possuir ou não extremos globais em K. Por exemplo, D = W‘ não
é um conjunto compacto, mas z = g[x, y) = cos(xy) possui máximos e
mínimos globais em B. Por outro lado, z = /i(x, y) = x + y não possui
máximo e nem mínimo global em D. Cada caso é um caso. Você precisa
usar outras ferramentas para decidir se / possui ou não extremos globais.

O teorema (4.2) fornece uma maneira simples de se identificar funções


contínuas. Mas como identificar conjuntos compactos? Freqüentemente,
em problemas de otimização, o conjunto admissível é modelado da seguinte
forma:

I? = { x e K" I h i ( x ) < Cl, . . . , h m ( x ) < C m } ,

onde h \ , . . . , h m são funções de R" para R. Agora, se as funções h\, hm


são contínuas, então pela proposição (4.2), os conjuntos

D l = { x 6 R" I / l l ( x ) < C l}, ..., Dm = { x € R" I /lm (x ) < C m ]


148 Continuidade, noções de topologia e o teorema de Weierstrass

são fechados. Como a interseção de um número finito de conjuntos fechados


é ainda um conjunto fechado (veja o exercício [15]), segue-se que

também é fechado. Infelizmente, ainda não se conhece um critério simples


que permita dizer se um conjunto da forma

{x e I /i(x) < c}

é limitado ou não. Veja, entretanto, o exercício [12].

P o n to in terio r

Intuitivamente, um ponto p é interior a um subconjunto D de se p


pertence a D e qualquer “pertubação” suficientemente pequena de p ainda
está em D.

D efinição 4.11 ü m ponto p é interior a um: subconjunto D de W


se existe uma bola aberta de centro p contida em I? 0 conjunto de
todos os pontos interiores de um conjunto D é denominado conjunto
interior áe D. $

Por exemplo, a origem (0,0) é um ponto interior da bola fechada B i(0 ,0)
de centro na origem (0, 0) e raio 1, pois podemos conseguir facilmente uma
outra bola aberta de centro em (0,0) contida em S i(0 ,0). Por outro lado, o
ponto (V^/2, \ / 2 / 2 ) não é um ponto interior de S i(0 ,0), pois sempre existirá
um ponto que não pertence a 5 i(0 ,0) em qualquer hold, aberta de centro em
(\/2/2, V2/2) (veja a figura (4.15)).
Não é difícil de se convencer que 0 conjunto interior da bola fechada
unitária jBi (0, 0) é a bola aberta unitária 5 i(0 ,0). Alertamos ainda que
0 interior de um conjunto pode ser o conjunto vazio. Isto acontece, por
exemplo, para uma reta em ou um plano em R^.

C onjunto a b e rto

Um conceito fortemente relacionado com a definição de ponto interior é


o conceito de conjunto aberto.
4.3 o teorema de Weierstrass no caso de n variáveis 149

Figura 4.15: O ponto p = (\/2 /2 , \/2 /2 ) não é um ponto interior da bola fechada S i(0 ,0 ).

D efinição 4 . 1 2 ( C o n ju n t o a b e r t o ) Dizemos que D C é aberto


se todos os seus pontos são interiores a D , isto é, se para todo ponto
p € jD existe uma bola aberta Sr(p) de centro em p e raio r > 0
contida em D.

A palavra “aberto” tem a conotação de “sem fronteira”: a partir de qual­


quer ponto podemos sempre nos mover a uma pequena distância em qualquer
direção e ainda ficar dentro do conjunto. A definição de um conjunto aberto
torna esta idéia precisa: cada elemento de um conjunto aberto possui uma
bola com centro neste elemento contida no conjunto.
E xem plo 4.2 A bola aberta Bi(0) de centro em 0 = (0,0) e raio 1 é um
conjunto aberto. De fato: seja p = [x^y) um ponto de 5i(0). Devemos
' mostrar que existe uma bola aberta Br{p) de centro em p contida em Si(0).
Seja
r = l-d(p,0).
(veja a figura (4.16)). Para mostrar que Br(p) está contida em Si(0), con­
sidere q um ponto em J5r(p). Pela desigualdade triangular (veja o teo­
rema (4.3)),
d(q, 0) < d(q, p) + d{p, 0) = d{p, q) + d{p, 0).
150 Continuidade, noções de topologia e o teorema de Weierstrass

Figura 4.16: A bola Bi_d{p,o){p) está contida na bola Bi{0)

Como d(p, q) < 1 - d(p, 0) vem que

d(q, 0) < 1 - d(p, 0) + d(p, 0) = 1 ^

A definição de um conjunto aberto também implica que estes conjuntos de­


vem ser “cheios”, pois um conjunto aberto em contém uma bola aberta
n-dimensional com centro em cada um de seus pontos. Conseqüentemente,
uma reta em R^ não é um conjunto aberto (veja a figura (4.17)). Analoga­
mente, retcis e planos em R^ não são conjuntos abertos.

Figura 4.17: Toda bola ab erta com centro em um ponto da reta contém pon­
tos fora da reta.
4.4 Exercícios 151

Existe uma proposição análoga à proposição (4.2) para conjuntos abertos:

Proposição 4.3 Se /i: K” M é contínua, então o conjunto


, {x 6 I h {x ) < c}f
é aberto em R”, onde c é uma constante reai.

4.4 Exercícios

[01] Dê três exemplos de funções contínuas e três exemplos de funções des­


contínuas definidas em R^.
[02] No exercício resolvido (4.3) mostramos que f{x, y) = x é uma função
contínua. Mostre agora que g{x,y) = y e h(x,y) = k = constante são
funções contínuas.
[03] Complete a demonstração do teorema (4.2) da página 128.
[04] Mostre que toda função polinomial
k
p{^>y) = ' Y^ a i - x ^ '-y* =
i=0
ao • X* 4- Oi • X* ^ - y-\---- Ok-i • x • j/* ^ + ak-y^

em duas variáveis x e y é contínua em R^.


[05] Mostre que a função
^ x^ -y
se {x,y) 7^ (0,0),
f { x , y) = < x ^ -t-j/2
0 se {x,y) = (0,0).

é contínua em (0,0).
[06] Enuncie outros teoremas importantes envolvendo continuidade que você
aprendeu no curso de Cálculo I.
*[07] Seja / : D C —)►R uma função contínua em p G D. Mostre que
se /(p ) > 0, então existe uma bola aberta -Br(p) de centro em p e
raio r > 0 tal que /(x ) > 0 para todo x € Sj.(p) fl D,
152 Continuidade, noções de topologia e o teorema de Weierstrass

[08] Resolva as questões abaixo.


(a) Dê três exemplos de conjuntos limitados e três exemplos de conjun­
tos não-limitados.
(b) Dê três exemplos de conjuntos abertos e três exemplos de conjuntos
que não são abertos.
(c) Dê três exemplos de conjuntos fechados e três exemplos de conjuntos
que não são fechados.
[09] Represente geometricamente cada um dos subconjuntos de abaixo e
diga se ele é um conjunto fechado ou não, aberto ou não, limitado ou
não, compacto ou não. Determine também o interior e a fronteira de
cada um destes subconjuntos.
(a) GR2 —1 < X < +1 e y
(b) X e y são números
(c) {(a:, 2/) € R2 x + y = l}.
(d) 6R2 x + y <l}.
(e) 6R2 x = 0 o n y - = 0}.
(f) {(a;, 2/) GR2 X= 0 e y > 0}.
(g) {(a:, 2/) eR 2 1< <2}.
(h) {(a:, 2/) G R2 0 < x^ + y^ < 2 } .
(i) {(a:, 2/) e R^ 1 < X < 2}.
(j) {(a:, 2/) GR2 X = 0 ou y := 0 ma
[10] 0 conjunto {(a:, 2/, z ) G R^ 1 X > o , y ;
pacto? Justifique sua resposta. Dica: represente geometricamente este
conjunto em R^.
[11] Mostre que se h: R^ —)►R é uma função contínua então os conjun­
tos {x E R” I /i(x) = c} — o nosso já conhecido conjunto de nível da
função h — e {x E R’^ | /i(x) < c} são conjuntos fechados para qualquer
escolha do número c.
[12] Mostre que o conjunto

{(xi,. . . , Xfi) E R 1 ^1 ^ ^ • • • 7a,ffi ^ ^ bffij

é limitado, onde a i , . . . , a^i, 6i,. . . , são constantes reais.


4.4 Exercícios 153

[13] Mostre que o teorema de Weierstrass não é mais válido se removermos


a hipótese de continuidade ou de compacidade do domínio da função /
exibindo:

(a) Uma função descontínua definida em um subconjunto K compacto


em que não possui nem máximo global e nem mínimo global
em K.
(b) Uma função contínua definida em um subconjunto F fechado mas
não-limitado (e, portanto, não-compacto) em que não possui
nem máximo global e nem mínimo global em F.
(c) Uma função contínua definida em um subconjunto L limitado mas
não-fechado (e, portanto, não-compacto) em que não possui nem
máximo global e nem mínimo global em L.

[14] Use o teorema de Weierstrass para dizer se é possível garantir, a priori^


se cada um dos problemas de otimização abaixo possui ou não uma
solução.

(a) Maximizar f(x,y) = x + y


sujeito às restrições; a; > 0, ?/ > 0 e < 1.
(b) Maximizar = x2 y
sujeito às restrições: x > 0 e y > 0.
(c) Minimizar f{x, y) = x • y
sujeito às restrições: x > 0^ y > 0 e x + y = l .
(d) Maximizar f{x, y) = sen(x2 + y^)
sujeito à re&trição: + j/^ < 1.
(e) Maximizar /(x , y) - sen(x^ +
sujeito à restrição: x^ + 2/^ < 1.
(f) Maximizar /(x , y) = sen(x^ +
sujeito à restrição: + í/2 _ I
(g) Maximizar f{x, y, z) = x + 2 y + 3 z
sujeito às restrições: x > 0^ y > 0^ z > 0 e x + y + z < l .
(h) Maximizar f{x,y,z) = X + 2 y + 3 z
sujeito às restrições: x > 0, y > 0 e z < + j/^.
(i) Maximizar f{x, y, z) = x + 2 y + 3 z
sujeito às restrições: x > 0 , y > 0 , z > 0 , x < l , y < l e z < l .
154 Continuidade, noções de topologia e o teorema de Weierstrass

*[15] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, justifi­
cando sua resposta.

(a ) Qualquer conjunto finito é um conjunto limitado.


(b) A interseção de dois conjuntos fechados é um conjunto fechado.
(c ) A interseção de um número infinito de conjuntos fechados é um
conjunto fechado.
(d) A união de dois conjuntos fechados é um conjunto fechado.
( e ) A união de um número finito de conjuntos fechados é um conjunto
fechado.
( f ) A união de um número infinito de conjuntos fechados é um conjunto
fechado.
(g ) Qualquer conjunto finito é um conjunto fechado.
(h) A união de dois conjuntos abertos é um conjunto aberto.
( i ) A união de um número finito de conjuntos abertos é um conjunto
aberto.
( j ) A união de um número infinito de conjuntos abertos é um conjunto
aberto.
(k) A interseção de dois conjuntos abertos é um conjunto aberto.
( l ) A interseção de um número finito de conjuntos abertos é um con­
junto aberto.
(m) A interseção de um número infinito de conjuntos abertos é um
conjunto aberto.
(n ) Um subconjunto fechado de um conjunto compacto é um conjunto
compacto.
( o ) A união de um número finito de conjuntos compactos é um conjunto
compacto.
(p) A união de um número infinito de conjuntos compactos é um con­
junto compacto.
(q ) A interseção de um número finito de conjuntos compactos é um
conjunto compacto.
( r ) A interseção de um número infinito de conjuntos compactos é um
conjunto compacto.
4.4 Exercícios 155

[16] Dê um exemplo de um conjunto que é aberto e fechado e dê um exemplo


de um conjunto que não nem aberto e nem fechado.
*[17] Seja Q C M o subconjunto dos números racionais. Q é aberto? Q
é fechado? Q é limitado? Q é compacto? Qual é o interior de Q?
Qual é a fronteira de Q? Responda a estas mesmas perguntas para o
subconjunto dos números irracionais.
*[18] Seja / : -> R uma função contínua em p = (pi,P2j • • • jPn)- Con­
sidere a função R R definida por g{t) = f { t , p 2, ... ,Pn)- Mostre
que g é contínua em p\. Este resultado implica que se f é contínua,
então sua restrição em qualquer reta paralela a um eixo coordenado é
também contínua. Contudo, a recíproca deste resultado é falsa. Consi­
dere a função
x - y,.2“
se {x,y) (0,0),
z = f { x, y) = < x2 + j/4
0 se (x, y) = (0,0).

(a) Mostre que /i(í) = f{t,p) e /2(í) = f{p,t) são funções contínuas
em t para cada valor de p fixo.
(b) Mostre que / , por sua vez, não é contínua em (0,0).

(L im ite de funções) Intuitivamente falando, dizemos que uma função


/ : D / C K" —>■ R possui limite L € R em p (não necessariamente no
domínio Df de f ) se /(x ) pode ser considerado uma aproximação de L tão
boa quanto se queira desde que x esteja suficientemente próximo de p. Mais
formalmente:

D e fin iç ã o 4 .1 3 Dizemos que L € R é b limite de / ; jD / C R" - t R


em p € E” se para. toda sequência x„ ->• p, com x„ e D / e x„ 7^ p,
tem -se /(x „ ) -4 L. Neste caso, escrevemos

lim / ( x ) L.

Estamos considerando os pontos p para os quais existe pelo menos


uma sequência -x^Ç. Df que converge para p (nesta situação, dizemos
que p é um ponto de acumulação de Df).
156 Continuidade, noções de topologia e o teorema de Weierstrass

[19] Calcule os limites abaixo, caso eles existam. Justifique sua resposta.

(a) lim
(x,3,)^(0,0) x2 + J/2
x+y
(b) lim
(x ,y H (l,l) ( x - 1 ) 2 + 1'

x^y + + x^ + j/2
(c) lim
(x,j^)->(2,3) a/ x2 + 2/2

4 x^ + 3 2/^ + x^y^
(d) lim „ „ H^ •
(x,j,)->(0,0) x2 + 2/2 + x^2/‘*

. lim cos(7ry)).

^ lim ^ cos(7TX2/)).

1
(s) (x,j/)^(0,0)
, li°í. 1 + ln(l + 1 / ( x 2 + 2/2)) ■

(Seqüências em R*” ) Como vimos, uma seqüência em R"* é uma aplicação


x: N ^ R*" que a cada n 6 N associa uma n-upla x„ = (xi,„, X2,n, • • •, Xm,n)
em R"*. Observe que x„ nada mais é do que uma coleção de N seqüências
numéricas:
X\ I N —V M
U h->- X\^JI

X2: N —> R
n X2,n

Xffi: N —)* R
TI ^Tn,n

Como em Cálculo I, podemos definir o conceito de convergência: converge


para p = (pi,P2, • • • ,Pn) se, e somente se, cada seqüência numérica Xi^n
converge para pi^ isto e, xi^n y pi, 3^2,n ^ P2-> • • •» ^ Pm* Uma
outra maneira de se caracterizar seqüências convergentes em R^ é através
da função distância e das bolas fechadas.
4.4 Exercícios 157

Dizemos que converge para p se, dado qualquer G N, existe um


índice no G N tal que para todo n > no tem-se que a distância entre
x„ e p é menor ou igual a 1/10^.

Ora, dizer que a distância entre x^ e p é menor ou igual a 1/10^ é justamente


dizer que x„ está na bola fechada B i / iqk{p ) de centro em p e raio 1/10^.
Assim:

Dizemos que x„ converge para p se, dado qualquer i í G N, existe um


índice no G N tal que para todo n > no tem-se que x„ G 5i/io/^(p),
isto é, o elemento x„ da seqüência está na bola fechada de centro em
p e raio 1/10^.

Intuitivamente falando, uma seqüência Xn converge para p se, dada qualquer


bola fechada de centro em p (e por menor que seja o raio desta bola), existe
um índice no a partir do qual todos os elementos da seqüência ficam dentro
da bola.

* [20] Mostre que x„ —)►p segundo a definição que vimos agora se, e somente
se, cada seqüência Xi^n —^Pi^ i = 1, . . . , A.

*[21] Mostre que se / : R é contínua em p G R’^ e /(p ) > 0, então


existe uma bola fechada ^^^(p) de centro em p e raio r > 0 tal que
/(q ) > 0 para todo q G ^^.(p).

Vamos agora generalizar o conceito de distância introduzido na seção (4.3).

D efinição 4.14 ( D i s t â n c i a b m R^) Uma dtstânaa em R^ é uma


função d* R^ X R^ “4 R que satisfaz três propriedades:
(1) d(x, y) > 0 e d(x, x) 0, para todo x , y G R^
(2) d(xj y) = d{y, x), para todo x, y G R^
(3) d(Xj y) < d(x, z) + d(z, y), para todo x, y , z G R"
A última condição é conhecida como desigualdade tnangular
158 Continuidade, noções de topologia e o teorema de Weierstrass

[22] Mostre que d: 'X -> R definida por

d (x,y) = m ax{|xi - yi\, \x2 - 2/2 I} ,

com X = {x\,X2) e y = {y\,y 2), é uma função distância em Faça


um desenho da bola de centro em (0, 0) e raio 1 construída com esta
distância. Mais geralmente, mostre que d: R’^ x R^ R definida por

d(x, y) = max{|a:i ~ yi\, \x2 - 2/2I, •.., - yn\] ,

com X = (xi, X2, . . . , Xn) e y = (j/i, ^2? • • • j 3/n) é uma distância em R^.
[23] Mostre que d: R^ x R^ -> R definida por

d(x,y) = |xi - y i \ + |x2 -2/2I,

com x = {xi^X2) e y = (j/i, 2/2)5 é uma função distância em R^. Faça


um desenho da bola de centro em (0, 0) e raio 1 construída com esta
distância. Mais geralmente, mostre que d: W x R^ —)>R definida por

d (x,y) = |a:i - 2/1I + |X2 - 2/2I + ------ h \xn - yn|,

com X = (a;i, 0:2, . . . , x^) e y = (2/1,2/25 ••• 5Vn) é uma distância em R’^.
*[24] Mostre que d: R^ x R^ —> R definida por

0 se X = y,
cí(x, y)
1 se X 7^ y .

é uma função distância em R^. Faça um desenho da bola de centro


em (0, 0) e raio 1 construída com esta distância.
*[25] O objetivo deste exercício é demonstrar o teorema (4.3), isto é, provar
que a distância euclidiana definida por

d(x,y) = '^{xi-yi)^,
\ i=i

com X = (xi, X25. • •, Xn) e y = (2/I5 ^25 • • • 5yn) atende as três proprieda­
des da definição de função distância.
(a) Mostre que d(x,x) = 0 para todo x E R^.
(b) Mostre que d(x, y) = d(y, x) para todo x, y G R’^.
4.4 Exercícios 159

(A desigualdade de Cauchy-Schw arz) Para demonstrarmos que a


distância euclidiana satisfaz a desigualdade triangular, vamos precisar
de uma desigualdade auxiliar, conhecida como desigualdade de Cauchy-
Schwarz:

E ■ \ U
E»i'

Para simplificar, vamos usar a notação:

X = l|y|| = ^ E í/^
\ i=i
(c) Mostre que ||x|| = 0 se, e somente se, Xi = 0 para todo i = 1, . . . , n.
(d) Mostre que a desigualdade de Cauchy-Schwarz é imediata se ||x|| =
0 ou llyll = 0.
Assim, resta demonstrarmos a desigualdade de Cauchy-Schwarz para
pontos X e y tais que ||x|| 0 e ||y|| 0. Ora, para quaisquer números
reais a e b, 0 < {a — b)'^ = — 2 ■a ■b + b'^ ou, equivalentemente.

2 ■a ■b < + b‘^. (*)


Como a e b são números arbitrários, podemos fazer a = |a;í|/||x|| e
b = |í/i|/||y|| em (*). Assim, para qualquer i

(**)
-
x|P ||yir
Ilvll2

Então, somando (**) com relação a z e usando \xi -yi\ = \xi\ • |y^|, temos

2= 1 ^ 2=1_______ 2=1 M , M
iwrilyll’
isto é.

2= 1
2- < 1.

Multiplicando-se ambos os membros por l|x||-||y||, temos a desigualdade


de Cauchy-Schwarz.
160 Continuidade, noções de topologia e o teorema de Weierstrass

Com a desigualdade de Cauchy-Schwarz podemos facilmente demons­


trar a desigualdade triangular para a distância euclidiana:
cí(x,y) < d(x,z) + d(z,y).
Observe que se d(x, y) = 0, então a desigualdade é imediata. Suponha
então que d(x, y) > 0. Agora,

y)^ = - Vi f = - ^i) + {^i - Vi)? =


2=1 2= 1
n
^ |(xi - Zi) + {Zi - y i ) \ - \ { xi - Zi) + {Zi - y i ) \
2= 1

Pela desigualdade triangular para números reais temos que


\ { xi - Zi) + {zi - y i ) \ < \xi - Zi\ + \zi - y i \ .

Assim,

á(x, y)^ < ^ |a:i - yi\ ■(l^i - Zi\ + \zi - yi\) =


2=1
n n
^ ^ 1^2 2/2 1 * 1^2 ^ ^ \xi yi\ • \zi yi\.
2=1 2= 1

Mas, pela desigualdade de Cauchy-Schwarz,

'^ \x i - yi\ ■\xi - Zi\ < ^ { x i - ZiY e


2=1 \|^=i________
n
^ ^ \ x i - yi\ ■ \zi - yi\ < A - 2/í)^
2=1 \ i=i
isto é,
n
'^{xi-yil-lxi-Zi\<d{x,y)-d{x,z) e
2=1
n
^ \xi - y i \ - \zi - yi\ < d(x, y) • d(z, y).
2=1

Então d(x, y)^ < d(x, y) • d{x,z) + d(x, y) • d{z,y). Como estamos
supondo d(x, y) > 0, podemos dividir por d(x, y) e obter a desigualdade
triangular d(x, y) < d(x, z) + d(z, y) para a distância euclidiana d.
4.4 Exercícios 161

[26] O toro do exercício [42] da página 119, definido como o nível w = 0 da,
função

w = f { x , y , z ) = {x^ + y'^ + z ^ + R'^ - (x^ + y^),

é um conjunto compacto em R^?


Capítulo 5

Derivadas parciais

Suponha que a função z = /(a;i, X2, . . . , modele o lucro 2: de uma


determinada empresa em termos dos insumos 2 : 2 , , Xn- Suponha ainda
que se conheça o lucro z* para uma escolha (x^, X2, . . . , x*) dos insumos:
z* = /(x*, ^ 2 , . . . , X*). Uma pergunta que surge imediatamente é como va­
riações nos valores dos insumos x*,X2, .. . , x* afetam o lucro da empresa.
Por exemplo, aumentando-se apenas a quantidade do primeiro insumo e
mantendo-se constantes os demais valores, o lucro da empresa estará au­
mentando ou diminuindo? E se fizéssemos isto para os outros tipos de in­
sumo? O que seria mais lucrativo? Por que não variar todos os insumos ao
mesmo tempo? Neste capítulo vamos introduzir os objetos matemáticos que
permitem encontrar as respostas para estas perguntas.

5.1 Lembrando Cálculo I

Você aprendeu em Cálculo I que a derivada de uma função / : M ->■ M


mede o quanto a função está variando: se {df/dx){xo) > Oe d f / d x é contínua,
então / é crescente em um intervalo aberto contendo x q . D o mesmo modo,
se {df /dx){xo) < O e d f / d x é contínua, então / é decrescente em um intervalo
aberto contendo xq. Quanto maior o valor da derivada, maior é a taxa de
variação. Mais ainda, você viu que o valor da derivada no ponto xq
é o coeficiente angular da reta tangente ao gráfico de / neste ponto e este
valor pode ser obtido através do limite do coeficiente angular da reta secante
ao gráfico de / pelos pontos (xq, f{xo)) e (x, /(x )) quando x xq:

f{x) - / ( xq)
^ (x o ) = lim
dx X Xq
164 Derivadas parciais

Podemos ainda reescrever este limite com a mudança de variável x = xç) + h\

dx /i->o h

Figura 5.1: Interpretação geométrica da derivada de um a função de um a variável.

5.2 Definições e exemplos

Para começar, considere uma função

/: ^
(x,y) H4- z = f { x , y )

e p = (a, 6). O que acontece com o valor z = f { x , y ) da função quando


variamos x nas proximidades de a e mantemos y constante e igual a ò? Ora,
se y = 6, então podemos construir uma nova função de uma única variável a
partir de nossa função de duas variáveis:

9-
X z = g { x ) = f { x , b) ■
5.2 Definições e exemplos 165

Para saber a taxa de variação de / no ponto (a, 6) mantendo-se y = h cons­


tante, basta derivar g no ponto x = a:

* ( „ ) = lin, = ito
dx ^ x—^a X —d x-^a X —CL
Este limite é tão importante que vamos usar um símbolo especial para ele:
f{x,b) - f{a, b)
(a, ò) = lim
dx X — a

{df /dx){a^ b) é denominada derivada parcial de / com relação a a: no ponto


(a, h). Geometricamente, estamos fazendo a restrição de / sobre a reta y = b
e olhando para a curva correspondente sobre o gráfico de / . Desta maneira, o
número (d f /dx) {a, b) = (dg/dx)(a) é o coeficiente angular da reta tangente
a esta curva no ponto (a, 6) (veja a figura (5.2)).

Figura 5.2: Interpretação geométrica da derivada parcial de 2: = f { x , y ) com relação a x.

Analogamente, podemos perguntar 0 que acontece com 0 valor da função


z = f{x^y) quando variamos y nas proximidades de ò e mantemos o valor
de X constante e igual a a. Novamente, se a: = a, então podemos construir
uma nova função de uma única variável a partir de nossa função de duas
166 Derivadas parciais

vanaveis:
h:
y i-> z = h{y) = f {a, y) '
Para saber a taxa de variação de / no ponto (a, 6), mantendo-se x = a
constante, basta derivar h no ponto y = b:

dy y-*b y —h y-*b y~ b
Como antes, vamos usar um símbolo especial para denotar este limite:

^ ( a , 6) = liin f { a , y) - f j a , b)
dy y->b y - b

é denominada d e r iv a d a p a r c ia l de / c o m re la ç ã o a y n o ponto
{ d f / d y ) { a , b)
(a, 6). Geometricamente, estamos fazendo a restrição de / sobre a reta
X = a e olhando para a curva correspondente sobre o gráfico de / . As­
sim, { d f / d y ) { a , b ) = { d h / d y ) { b ) é o coeficiente angular da reta tangente a
esta curva no ponto (o, 6) (veja a figura (5.3)).

Figura 5.3: Interpretação geométrica da derivada parcial de 2; = f { x , y) com relação a y.

Como [ d f / d x ) { a ^ h ) e [ d f / d y ) [ a ^ b ) são derivadas, você pode aplicar tudo


o que aprendeu em Cálculo I para concluir propriedades sobre o comporta-
5.2 Definições e exemplos 167

mento de / . Por exemplo, para funções / tais que suas derivadas parciais
d f / d x e d f / d y são contínuas, vale que:

• Se {df/dx){a, b) > 0, então / cresce quando mantemos y = b constante


e aumentamos localmente o valor de x com relação a a,
• Se {df/dy){a^ b) > 0, então / cresce quando mantemos x = a constante
e aumentamos localmente o valor de y com relação a b.
• Se (9 //9 x )(a , 6) < 0, então / decresce quando mantemos y = b cons­
tante e aumentamos localmente o valor de x com relação a a.
• Se {df /dy){a,b) < 0, então / decresce quando mantemos x = a cons­
tante e aumentamos localmente o valor de y com relação a 6.

Vamos ver como tudo isto funciona com um exemplo.

Exem plo 5.1 A função de produção Cobb-Douglas


z = f {x, y) = 4 •
modela a produção de uma certa empresa em função do capital x e do tra­
balho y. Assim, por exemplo, com capital x* = 10000 e trabalho y* = 625, a
produção desta firma é de
2* = f{x*, y*) = /(lOOOO, 625) = 4 • = 20000
unidades. Vamos agora calcular a taxa de variação da produção no ponto
(10000, 625) quando mantemos a quantidade de trabalho constante e vari­
amos a quantidade de capital [o que significa calcular (9 //9 x ) (10000,625)]
e, de maneira recíproca, calcular a taxa de variação da produção no ponto
(10000, 625) quando mantemos a quantidade de capital constante e variamos
a quantidade de trabalho [o que significa calcular (9 //9 y ) (10000,625)]. Para
isto, vamos construir as funções auxiliares
Z = g{x) = /(x,625) = 4• • (5^)1/^ = 20 • x3/^
z = h{y) = /(10000,y) = 4 • (lO^)^/^ • = 4000 •
Desta maneira.

^(10000,625) = ^(10000) = 15 • x"^/^ = 1.5,


C/tC CLX x=10000

1^(10000,625) = ?^(625) = 1000 • = 8.


oy ay y=625
168 Derivadas parciais

Uma vez que (ô//9x)(10000,625) = 1.5, se a quantidade de trabalho y* é


mantida constante e aumentamos a quantidade de capital x* em h unidades,
então a produção sofrerá um aumento de aproximadamente 1.5 • h unidades.
Por exemplo, para um acréscimo de 10 unidades no capital x*, a produção
aumentará em aproximadamente 15 unidades. Analogamente, uma vez que
(9 //9 í/)(10000, 625) = 8, para um decréscimo de 2 unidades no trabalho ?/*,
a produção diminuirá em aproximadamente 16 unidades.
Para esta empresa, no ponto (x*, j/*) = (10000,625), entre aumentar o ca­
pital ou aumentar o trabalho, é mais produtivo aumentar o trabalho. Con­
tudo, como veremos, a estratégia mais produtiva de todas é aumentar o
trabalho e o capital ao mesmo tempo na proporção 1.5/8 = 0.1875 (veja o
capítulo 8 sobre derivadas direcionais e o vetor gradiente). ^

Dada uma função / e um ponto (a, b), podemos calcular as derivadas parciais

|í ( e . 6 ) = - /( - .» e
OX x-^a X —a

^Q( n
(fl, 0
M) - lirn
lím
oy y-^b y —0

(caso os limites existam) associadas ao ponto (a, 6):

(a , b) I-)- |^ ( a , b) e {a, b) ^ (a , 6 ).

Se fizermos esta associação para cada ponto (a, 6) de (supondo que os limi­
tes sempre existam) estaremos criando duas novais funções de duas variáveis:

dx dy
df ®
{x,y) ^
que a cada ponto (x, y) em R^ associam, respectivamente, as derivadas par­
ciais com relação a x e a y no ponto (x, y).
Mais ainda, a própria definição de derivadas parciais sugere um método
prático para calcular estas funções de derivada parcial: quando queremos
derivar f com relação a x, consideramos y como uma constante e efetua­
mos a derivada como se estivéssemos em Cálculo I e, analogamente, quando
5.2 Definições e exemplos 169

queremos derivar f com relação a y, consideramos x como uma constante e


procedemos normalmente com o cálculo da derivada.

Exem plo 5.2 Considere a função z = f(x^y) = 3 + 4 xy^ + 7y. Vamos


calcular d f / dx considerando y como uma constante. A primeira parcela é
vezes uma “constante” (3 í/^) de modo que sua derivada é 2 x vezes a
constante, isto é
^ (3 x^y^) = 2 x - 3 y ^ = 6 xy"^.

A segunda parcela é uma “constante” vezes a;, assim, sua derivada é a própria
constante

Finalmente, desde que consideramos 7 y como uma constante no cálculo da


derivada parcial com relação a x, segue-se que sua derivada é zero:

(72/) = 0.
dx
Colocando tudo isto junto e usando o fato de que a derivada da soma é a
soma das derivadas, obtemos que

(3 x%'^ + 4 xy^ + 7y) = 6 xy'^ + 4 y^.


dx
Para calcular a derivada parcial com relação a y, tratamos x como uma
constante. A primeira parcela àe f é y^ vezes uma constante de modo que
sua derivada com relação a y é 2 y vezes a constante:

( 3 x V ) = (2y) • (3a;^) = 6 x'^y.


dy
A segunda parcela é y^ vezes uma constante, assim, sua derivada com relação
a y é 3y^ vezes a constante:

{ixy^) = (3y^) • (4x) = 12


dy
Finalmente, a derivada com relação a y de 7 y é, naturalmente, 7. Colocando
tudo isto junto, encontramos que
d
— (3 XV + 4 xy^ -I- 7 y) = 6 x^y -I-12 xy^ -t- 7. ^
dy
170 Derivadas parciais

Para o caáo de uma função / de três variáveis x ,y e z , temos três derivadas


parciais, uma para cada variável:

o w lim j
OX X —a

y -(a ,h ,c ) =
dy ^ y —b

|í ( a ,6 ,c ) =

A regra prática continua valendo: quando derivamos / com relação a x consi­


deramos y e z constantes, quando derivamos / com relação a y consideramos
X e z constantes e quando derivamos / com relação a z consideramos x e
y constantes. Mais geralmente, para uma função de n variáveis, temos a
definição a seguir.

D éân ição 5.1 (PÉRIVAD^ PAlíctAI,) ^Seja K. Eritão para,


cada,variável Xf ejn cadá ponto p = (p i,...,P n ) no domínio de / ,
-definimos a deriUá^a parcial de f com rèlação a Xi no ponto p como o

^ ( P l , . .. ,p„) = ^lim /(Pl> , Pn)


Xi Pi
%
caso lim ite existk.,,Sotuénte á^-ésmaa çòòrdêj^ variação. As
demais coordenadas permanecem constóntes. ,

Com a mudança de variável X{ = Pi + podemos escrever ainda

^ ^ /(pi) • . . ,Pi + /i, . . . ,Pn) ■“ /(p ij • • • jPí ) • • • )Pn)


Q IPI, • • ■,Pnl - lim - .

Existem outras duas notações para a derivada parcial de uma função z


f { x \ , . . . , x„) com relação a Xi\

^f
^ ( P l , • • • ,Pn) = /ii(Pl, • • • ,Pn) = A /(P l, • • • ,Pn).
5.2 Definições e exemplos 171

CUIDADO! CUIDADO! CUIDADO!

O “x” que aparece na notação d f / d x serve apenas para indicar que


estamos derivando a função / com relação à primeira variável! Por
exemplo, as duas funções abaixo

-2^= f { x , y) = 4 • ■ <1/4 U = 3( s , í ) = 4 - s3/4. í 1/4

são iguais pois elas possuem o mesmo domínio, o mesmo contradomínio


e a mesma regra de associação, apesar de aparecerem “letras” diferentes
na definição de cada uma. Assim, tanto d f / d x quanto dg/ds querem
dizer a mesma coisa: a derivada parcial da (mesma) função com relação
à primeira variável. Neste sentido, a notação D i/ é a mais clara, uma
vez que ela não se compromete com o uso de “variáveis auxiliares”.

A definição (5.1) de derivada parcial pressupõe que a função / esteja


definida em todo W . Contudo, é possível fazer uma extensão desta definição
para funções mais gerais: se f : D f C M e p = (p i,...,P n ) ^ -D/,
então basta garantirmos que seja possível avaliar o quociente de Newton

Xi-Pi

em pontos (p i,. . . , x^,... ^pj/) para todo xi suficientemente próximo de pi e,


sendo assim, podemos indagar se o limite

f{pi, ...,X i,...,Pn)- f{pl, ...,Pi,...,Pn)


lim
Xi-Pi

existe ou não. Caso ele exista, definimos o seu valor como sendo a derivada
parcial de / com relação a xi no ponto p.
Geometricamente, dizer que é possível avaliar o quociente de Newton para
todos os pontos (p i,. . . , x^,... ,p„) próximos de (p i,... ,p i,... ,p„) significa
dizer que existe um segmento de reta paralelo ao eixo xi inteiramente con­
tido em Df^ onde p é o ponto médio deste segmento. Mais informalmente,
podemos “caminhar” um pouco para frente e para trás, a partir do ponto p,
paralelamente ao eixo x^, sem sairmos do domínio í?/ de / .
172 Derivadas parciais

Por exemplo, considere uma função / ; D / C —)• R definida em um


conjunto Df dado na figura (5.4). Podemos definir as duas derivadas parciais
de / no ponto p. Agora, para o ponto q, podemos definir apenas a derivada
parcial de / com relação a x. No ponto r não podemos definir nem a derivada
parcial com relação a x e nem a derivada parcial com relação a y.

Observe que sempre podemos definir todas as derivadas parciais em um


ponto interior do domínio da junção.

Figura 5.4: A relação entre a topologia do domínio de uma função e o con­


ceito de derivada parcial.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Um abuso de notação cometido por muitos autores é o de se omitir os


pontos onde as derivadas parciais são calculadas, com a justificativa de
economia de espaço nas fórmulas. Assim, por exemplo, as derivadas
parciais áe z = f {x, y) = são indicadas por

| í = 3 i-V y /^ e ^ = i-V y /4
ox oy
ao invés de

|^ ( x ,í/) = 3x e ^{x,y) = x

Mais ainda, alguns autores trocam o nome da função pela variável que
5.2 Definições e exemplos 173

representa o valor da função em um ponto do domínio:

= 3X
dx dy
Estes abusos de notação podem causar confusão (veja, por exemplo, as
observações da página 278 sobre as complicações deste abuso de notação
com relação à regra da cadeia). Em nosso texto, estes abusos foram
evitados ao máximo e eles aparecem apenas em alguns exercícios.

Uma vez que a derivada parcial de uma função de várias variáveis nada
mais é do que a derivada de uma função adequada de uma única variável,
as propriedades da derivada com relação à soma, multiplicação e divisão
transferem-se imediatamente para o caso de funções de várias variáveis.

T eorem a 5.1 (PROPRIEDADES DA d e r i v a d a " f à r õ ia l ) Gõnsiderê


/: D / C C -4 R e p € D f f l D g . Suponha que as
derivadas parciais

áe f e g com relação a X{ no ponto p existam. Então:


(a) A derivada parcial de / + 5 com relação a Xi no ponto p existe e

- |: ( /+ .) ( p ) = g ( p ) + |( p ) .

(b) A derivada parcial de / *p com relação a Xi no ponto p existe e

|; ( / - p ) ( p ) = f ( p ) - p ( p ) + / ( p ) - | ( p )

(c) Se p(p) ^ 0, então a derivada parcial de f / g com relação a no


ponto p existe e

0 /, dg
± ( l \ , , ^ ã ^ ( P ) p ( p ) - / ( P ) ã ;;(P )
dxi U / {gip)f
174 Derivadas parciais

5.3 Derivadas parciais de ordem superior

Dada uma função z = / ( i , y) de duas variáveis, suas derivadas parciais

dj_
dx dy

também são funções de duas variáveis! Podemos então derivar parcialmente


d f / d x e d f / dy gerando as derivadas parciais de segunda ordem da função /;

A l(d f
dx {d x dx^

(d f
dy '{ dx,

A l d^f
dx { d y

A l( d f
dy '{ dy.

Exem plo 5.3 No exemplo (5.2) calculamos as derivadas parciais da função


z = f { x, y) = 3 a ;V + 4 xi/^ + 7 i/:

{x,y) = 6 xy^ + Ay^ e = 6 x \ +12xj/^ + 7.


dx dy

Desta maneira,

= 6j/2,

= 12xy + 12y^,

” ^ ( 6 i ^!/+ 12is(*+ 7) = I2IV + 12s^

+ + = 6 x^ + 24xy.
5.3 Derivadas parciais de ordem superior 175

Portanto,
d^f d^f

ay
{x, y) = 1 2 xy + 12 e (x,y) = 6 a;^ + 24 xt/.
dxdy

Uma função de três variáveis possui 9 derivadas parciais de segunda ordem:

ay ay ay ay ay ay ay ay ay
ax^’ d x d y ' d x d z ’ d y d x ' dy"^' d y d z ' d z d x ’ d z d y ’ dz'^'
Uma função de n variáveis possui derivadas parciais de segunda ordem:
d^f
dxidxj ’
para i = 1 ,..., n e j = 1 ,..., n. A derivada de segunda ordem com relação
a XiXi é usualmente denotada por

dx^i
ao invés de d^^f/dxidxi. As derivadas parciais de segunda ordem da forma
d^^f/dxidxjj com í / são denominadas derivadas parciais mistas. Como as
derivadas parciais de segunda ordem de uma função de n variáveis também
são funções de n variáveis, podemos derivá-las parcialmente e obter as de­
rivadas parciais de terceira ordem de / . Este processo pode ser continuado
a fim de obter as derivadas parciais de ordem superior, enquanto os limi­
tes que definem as derivadas parciais existirem. Observe que uma função
de n variáveis possui derivadas de terceira ordem, derivadas parciais
de quarta ordem, etc.
A definição a seguir estabelece um critério de suavidade da função em
termos da continuidade das derivadas parciais de ordem superiqr.

D efinição 5,2 ( P u n ç ã o d e c l a s s e C^) Dizemos que uma função


f:DfC M é de classe se todas as derivadas pardais de
ordem < k existem e são contínuas em D f. Uma função é de classe
se ela é contínua e é de classe se possui todas as derivadas parciais
de todas as ordens contínuas* .
176 Derivadas parciais

5.4 O teorem a de Young

No exemplo (5.2), calculamos as derivadas parciais de segunda ordem de


z = /(x , y) = 3 + 4 xy^ + 7 y. Observe que

-{x,y) = 12a;y + 12y^ = ^ - ^ ( x , y ) ,


dxdy dydx
isto é, as duas derivadas parciais mistas de / são iguais. Isto não é uma
coincidência!

T eorem a 5.2 (Y oung ) Suponha que z = f{^x, ,^n)- seja de


classe CP' em um conjunto aberto £7 de R” . Então, para todo x € £7 e
para cada par de índices i, j, vale que

dxídxj (x) ^ ^dxjdxi


r^ (x ).

A demonstração do teorema de Young requer o uso do teorema do valor


médio de Cálculo I. Você pode encontrá-la na referência [01], página 277.

Exem plo 5.4 Considere a função de produção Cobb-Douglas geral 2 =


f {x, y) — kx°'y^. Então

^ ( a ;,y ) = akx°‘~'^y^, ^ hkx°‘y^~'^,

^ ( x ,y ) = abkx<^-y-'^ e = abkx^-^y’>~\

com as duas últimas expressões iguais, como afirma o teorema de Young. ^

O teorema de Young pode ser generalizado para derivadas parciais de


ordem superior. Por exemplo, se z = /(a^i, X2, X3, X4) é de classe então

d^f d ^f 93/
dx\dx2dx4 dx\dxidx2 dx2dx\dxi
d^f 53/ ô3/
dx2dxidxi dxidx\dx2 dxidx2dx\'
5.5 Exercícios 177

N otação. Outra notação freqüentemente usada para derivadas parciais de


segunda ordem inclui
av av
— fyx — 6 — f x jX i — D j i f .
dxdy ^ ’ dxidxj
Estes mesmos truques de notação também são usados para indicar derivadas
parciais de ordem superior, tais como fijk e assim por diante.

5.5 Exercícios

[01] Determine as derivadas parciais de primeira ordem das funções de duas


variáveis abaixo.

(a) z = /(r , s) = \ / r ‘^ + s^.


(b) z = f{s, t) = t / s - s/t.
(c) z = f{x, y) = 2 x V - xy'^ + 3y + l.
(d) z = f{t, v) = In ^ ( t + v ) / ( t - v ) .
(e) z = f { x , y) = { x ^ - y ^ f .
( f ) z = f { x, y) = xé> + y sen(x).
(g) z = /(x ,y ) = e^ln(xy).
(h) z = /(x , y) = Xcos(x/y).
[02] Determine as derivadas parciais de primeira ordem das funções de três
variáveis abaixo.
(a) w = f { x , y , t ) = (x^ - í ^ ) / ( l + sen(3y)).
(b) w = /(x , y, z) = (y2 + z^)=".
(c) w = f{r, s, u) = (2 r + 3
(d) w = /( r , s, t) = cos(í).
(e) w = /(x , 2/, z) = xe^ — ye^ + ze~'^.
(f) w = /(x , y, z) = xyzé"'^\
[03] Na figura (5.5) encontram-se os gráficos de três funções de duas variáveis:

/, df/dx e df / dy.

Faça uma identificação entre os gráficos e as funções.


178 Derivadas parciais

Figura 5.5: Os gráficos de / , d f / d x e d f / d y .


5.5 Exercícios 179

[04] Para cada uma das funções abaixo verifique que w^y =
(a) w = xyz.
(b) w = —2 x^y^ + 4 —3 y.
(c) w = x^/(x + y).
(d) w = + y“^cos(x).
(e) w = + l/(a;V )-
(f) w = ^Jx^ + y^ z^.

[05] Resolva as questões abaixo.

(a) Calcule Wxyz para w = 3 x^y^z + xy‘^z^ — yz.


(b) Calcule Wtut para w = u*vt^ — 3 uvH^.
(c) Calcule Wzzy para w = y ln(x^ + z^).

[06] Resolva as questões abaixo.

(a) Calcule d^w/dzdy^ para w = x^/(y^ + z^).


(b) Calcule d^w/dzdydx para w = sen(xyz).

[07] (Função harmônica) Uma função 2 = f { x i , . . . , x„) é harmônica se


ela satisfaz a equação de Laplace
d^z d'^z d^z
dxl dxl Qx^

Mostre que z = f { x, y) = x^ — 3xy^ e z = g{x,y) = In -^x^ + y2 gão


funções harmônicas.

[08] Quais destas funções satisfazem a equação de Laplace (veja a questão


anterior)?

(a) z = /(x , y) = x ^ ~ y2.


(b) z = /(x , y) = x^ + y2.
(c) z = /(x ,y ) - xy.
(d) z = /(x , y) = y3 + 3 x^y.
(e) z = /(x ,y ) = e^seny.

[09] Se ín = e~'^*^ sen(cx), mostre que Wxx = wt para todo real c.


180 Derivadas parciais

[10] Mostre que v = sen(fc x) ■sen{ak t) satisfaz a equação da onda

d“^v _ 2
dt"^ ^ dx^

[11] Seja C a curva resultante da interseção do parabolóide z = 9 —


com 0 plano x = 1. Determine a equação da tangente / a C no ponto
P = (1,2,4). Esboce o gráfico do parabolóide, de C e de l.
[12] Calcule

3 + (x + y + h ^ z - (3 + (x + y)^z)
lim
h—^0

[13] Utilizando diretamente a definição de derivadas parciais, calcule d f / d x


e d f / d y para as funções / dadas abaixo.
(a) 2 = /(x ,y ) = x + 2y.
(b) z = f { x, y) = x ‘^ + 3y^.
[14] Encontre /i( 0 ,0) e fy{0,0) para

1 x^ + y^ se (x,y) (0,0),
z = f{x,y) = < x^ + y2
^0 se (x,y) = (0,0),

e 5 i ( 0 , y), com y € M, para


í x^ —xy se (x,y) 7^ (0,0),
z = g{x,y) = ■{ X + y
se (x,y) = (0,0).

[15] Encontre fx{x,y) e fy{x,y) para as funções abaixo.

(a) z = /(x , y ) = í
JX
ln(sen(í)) dt.

(b) z = / ( x ,y ) =
JX
[16] Calcule todas as derivadas parciais de primeira ordem da função

u = y(x,y, z) = xz + d^ .
5.5 Exercícios 181

[17] Calcule todas as derivadas de terceira ordem da função de produção


Q= Use o teorema de Young para acelerar o processo.

[18] Seja z = /(x , y) = x V - 2;®+


(a) Calcule d^z/dydxdx, d^zldxdydx e d^z/dxdxdy.
(b) Calcule d^z/dxdydy, d^z/dydxdy e d^z/dydydx.

* [19] O objetivo deste exercício é examinar uma função de classe para a


qual a tese do teorema de Young falha: as derivadas parciais mistas não
são iguais. Seja

. = se (0,0),
[0 se (x,í/) = (0,0).

(a) Prove que / se anula sobre os eixos x e y. Conclua então que


{df / dx) { 0, 0) e {df/dy){ 0, 0) são iguais a zero.
(b) Calcule d f / d x e d f / d y para pontos {x,y) ^ (0,0) e conclua que
{ df / dx){ 0, y) = - y e {df/dy){x, 0) = x.
(c) Mostre que

d (df
Sj ( s i j JíS y -0

(d) Mostre que

_a
M = (0,0) = hm ^ ^ -------= +1
dxdy dx \ d y J X —0
e conclua que as derivadas parciais mistas de / não são iguais
em (0,0).
(e) Calcule {d'^f/dxdy){x,y) para (x,y) 7^ (0,0).
(f) Use 0 item anterior para mostrar que {df'^/dxdy){x,x) = 0 para
X > 0.

(g) Conclua que f / dxdy) (x, y) é descontínua na origem (0,0) (assim,


/ não é uma função de classe C^) que é a hipótese do teorema de
Young não se verifica.
182 Derivadas parciais

[20] Seja 2; = f {x, y) = g{x) • h{y) onde g e h são funções diferenciáveis


de uma única variável. Encontre uma expressão para d f / d x e d f /dy.
Dica: lembre-se como calcular uma derivada parcial de maneira prática!
[21] Estabeleça os mesmos resultados da questão anterior com 0 uso direto
da definição de derivadas parciais.
[22] Qual é a diferença (se é que existe) entre d^^f/dx"^ e (9//0x)^?
[23] Calcule todas as derivadas parciais de ordem 1 da função

z = / ( x i , . . . , x„) = Xi + • • • + x^.

[24] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : -> R é uma função de classe satisfazendo /a;(0,0,0) = 0,
/2,(0,0,0) = 0 e /^(0,0,0) = 0, então f{x^y, z) = 0 para todo
{x,y,z) €
(b) Se / : ^ R é uma função de classe satisfazendo fx(x,y, z) =
0, fy{x,y,z) = 0 e fz{x,y,z) = 0 para todo (x,y,z) G R^, então
/(x , y,z) = 0 para todo (x, y, z) G R^.
[25] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se f : D C é uma função de classe definida no conjunto
aberto
D = {(x,í/, z) G R^ I X < l} U {(x,y, z) G R^ | x > 2}
satisfazendo fx{x,y,z) = 0, fy{x,y,z) = 0 e fz{x, y, z) = 0 para
todo (x, y, z) G D, então /(x , y,z) = 0 para todo (x, y, z) G D.
(b) Se / : D C R^ ^ R é uma função de classe definida no conjunto
aberto
D = {{x, y, z) G R^ 1 X < l } U {(x ,t/,z) G R^ | x > 2}
satisfazendo fx{x,y,z) = 0, fy{x,y,z) = 0 e fz{x,y,z) = 0 para
todo (x, y,z) E D e / ( 0 ,0,0) = 0, então /(x , y, z) = 0 para todo
(x, y, z) G D.
5.5 Exercícios 183

[26] A Companhia ACME produz três tipos de roller skates. O custo em


reais para se produzir y e z unidades de cada tipo de skate é

c(x, y, z) = 30000 + 27 x + 36 y + 47 z.

(a) O valor dcfdx representa a taxa variação no custo devido ao acrés­


cimo de uma unidade na produção do skate mais barato, sendo que
os níveis de produção das outras unidades mais caras permanecem
constantes. Encontre esta taxa.
(b) Encontre dc/dz e forneça uma interpretação.

[27] Quando um poluente tal como óxido nítrico é emitido por uma chaminé
de h metros de altura, a concentração C{x^y) (em do poluente
em um ponto P situado a y metros acima do chão e cuja projeção
ortogonal sobre o chão está a x quilômetros da base da chaminé pode
ser representada por

C{x,y) = ^

em que a e b são constantes positivas que dependem das condições


atmosféricas e da taxa de emissão do poluente (veja a figura (5.6)).
Suponha que

Figura 5.6; Concentração de um poluente emitido por uma chaminé.

C(x,y) = ^ + e-o.02(,+io)Vx^j .

Calcule e interprete dCj dx e dC/ dy no ponto P = (2,5).


184 Derivadas parciais

[28] A análise de certos circuitos eletrônicos envolve a fórmula


y
1 =

em que / é a corrente, V a voltagem, R a resistência, L a indutância e


Lü uma constante positiva. Calcule e interprete d l / d R e dl / dL.

[29] A maioria dos computadores tem apenas um processador que pode ser
utilizado para cálculos. Os supercomputadores modernos, entretanto,
têm entre dois a vários milhares de processadores. Um supercomputador
multiprocessador é comparado a um computador uniprocessador em
termos de speed up. A speed up S é o número de vezes mais rápido
que um cálculo pode ser feito com um multiprocessador do que com um
uniprocessador. A lei de Amdahl é uma fórmula para determinar S:
P
S{p,q) =
q+p-{l-qY
em que p é o número de processadores e g é a fração de cálculo que pode
ser realizada utilizando todos os processadores disponíveis em paralelo,
isto é, usando-os de maneira que os dados sejam processados conco­
mitantemente por unidades separadas. A situação ideal, paralelismo
completo^ ocorre quando q = 1 .

(a) Se q = 0.8, ache o speed up quando p é igual a 10, 100 e 1000.


Mostre que o speed up S não pode exceder 5, independentemente
do número de processadores disponíveis.
(b) Ache a taxa de variação de S em relação a q.
(c) Qual a taxa de variação no item anterior se há paralelismo com­
pleto? Como o número de processadores afeta esta taxa de va­
riação?

A eficiência E de um cálculo por multiprocessador pode ser calculada


pela equação
S{p,q) 1
E =
q+p-{l-qY
(d) Mostre que se 0 < g < 1, então E é uma função decrescente de p.
Conclua que sem paralelismo completo, o aumento do número de
processadores não aumenta a eficiência do cálculo.
5.5 Exercícios 185

[30] No estudo da penetração da geada em uma rodovia, a temperatura T


no instante t e k profundidade x pode ser dada aproximadamente por
T = Toe~^'^ sen{ujt — Xx),
em que Tq, o; e A são constantes.
(a) Calcule e interprete as derivadas parciais dT/ dt e dTfdx.
(b) Mostre que T satisfaz a equação unidimensional do calor.
9 T _ d^T
dt “ ^ 9 x 2 ’
com k = 2 \^/w .
[31] A capacidade vital V dos pulmões é o maior volume de ar que pode ser
exalado após uma inalação de ar. Para um indivíduo do sexo masculino
com X anos de idade e y centímetros de altura, V pode ser aproximada
pela fórmula
y == 27.63 X - 0.112?/.
Calcule e interprete as derivadas parciais dV/ dx e dVjdy.
[32] Em um dia claro, a intensidade da luz solar às t horas após o nascente
e à profundidade oceânica de x metros, pode ser aproximada por
I{x^t) = Ioe~^^ sen^{7Tt/D),
com I q a intensidade da luz solar ao meio-dia, D a quantidade horas do
dia com luz solar e k uma constante positiva. Se / q = 1000, D = 12
e k = 0.10, calcule e interprete as derivadas parciais d l / d t e d l j d x
quando t = 6 horas e x = 5 metros.
[33] Em Economia, a elasticidade de preço de procura de um artigo indica
a reação dos consumidores a uma alteração no preço de mercado do
artigo. Suponhamos que n artigos Ai, A2, . . . , A„ tenham preços pi,
P2) • • •) Pm respectivamente, e que a demanda pelo artigo seja uma
função Qk dos preços pi, P2, • • •, Pn^
qk = f k { P l , P 2 , - - - , P n ) -

A elasticidade de preço do artigo é a, função e^ (que depende dos


preços pi, P2, . . . , Pn) definida por
Pk dçk
^k = — ^—•
Qk opk
186 Derivadas parciais

Mostre que se modelarmos a demanda com uma Cobb-Douglas


= ....pr*'", w
onde afc^i, • • •, CLk,n são constantes não-negativas, então a elastici­
dade ejfc será uma função constante.
Diz-se que o artigo Ak é independente do artigo Aj se uma variação no
preço pk de Ak não afeta a demanda qj de Aj. Isto equivale à condição
dqj/dpk = 0. Mostre que se a demanda qk é modelada pela Cobb-
Douglas (*), então Ak é independente de Aj se, e somente se, aj^k = 0.
[34] Mostre que para toda constante positiva c, a função

u(x.t) = ------------------------------- õ
^g(x-cí) ^

satisfaz a equação de Korteweg-de Vries (KdV):


Ut{x,t) + Uxj:x{x,t) + u { X j t ) • U x{ x, t) = 0
Esta solução (denominada sóliton) representa o perfil de uma onda de
água navegando por um canal estreito.

5.6 N ota histórica

A notação duj dx foi usada pela primeira vez por Adrien Marie Legendre
em 1786 em sua obra ^^Memoire sur la manière de distinguer les maxima des
mínima dans le Calcul des Variations”. Na página 8 está escrito:

Pour éviter toute ambiguitéj je représenterai par duj dx le coeffici-


ent de x dans la différence de Uj & par dujdx la différence complete
de u divisée par dx.

Legendre abandonou o símbolo e ele foi reintroduzido por Cari Gustav Jacob
Jacobi, em 1841, em seu artigo "De determinantibus Functionalibus”:

Sed quia uncorum accumulatio et legenti et scribenti molestior fieri


soletj praetuli characteristica d differentialia vulgariaj differentialia
autem partialia characteristica d denotare.

O símbolo d é algumas vezes chamado de delta de Jacobi e ele corresponde


à letra "d” do alfabeto russo.
Capítulo 6

Curvas parametrizadas,
transformações lineares e outras
funções vetoriais

Até 0 presente momento, estudamos apenas funções do tipo

/: D C

que a cada ponto x G í? associa um único número real = /W - Uma


função cujo contradomínio é o conjunto R dos números reais é denominada
função escalar ou campo escalar. Vamos agora estender o nosso estudo para
funções cujo o contradomínio é R’^. Uma tal função é denominada função
vetorial ou campo vetorial

6.1 Curvas parametrizadas

Um primeiro exemplo muito importante de uma função vetorial é dado


pela definição de curva parametrizada^ que nada mais é do que uma função
a : / C R ^ R^
t H- a(t) = X2(í), • • •, a:m(í)),
cujo domínio é um intervalo I da reta real e o contradomínio é R”^. Curvas
parametrizadas são utilizadas para se modelar m quantidades (posição de
um objeto, trabalho e capital de uma empresa, etc) que variam no tempo.
Assim, 0 intervalo I usualmente representa um intervalo de tempo e a (í)
representa o valor das m quantidades no instante de tempo í E /. Algumas
vezes, a variável t é denominada de parâmetro da curva parametrizada a .
188 Curvas parametrizadas, transformações lineares e outras funções vetoriais

A representação geométrica mais importante de uma curva parametrizada


é o seu traço.

D efinição 6 . 1 ( T r a ç o d e u m a c u r v a p a r a m e t r i z a d a ) Considere
a ; / C M —>• K'” uma curva parametrizada. 0 traço de a é o conjunto
{a{t) e R”* \-t G /}
Para cada instante de tempo í, a (f) é um ponto em M'™. O traço
da curva parametrizada a nada mais é do que a união de todos estes
pontos em

Se, por exemplo, a (í) representa a posição de um objeto no instante de


tempo í, o traço da curva representa,- neste caso, a trajetória do objeto.
Vamos ver como tudo isto funciona com um exemplo.

Exercício resolvido 6.1 Suponha que a posição de um objeto (um ponto


material) movendo-se no plano seja descrita pela curva parametrizada
a : R ->• R2
t i-> a(<) = ( H - í , 3 - 2 - í ) ■
(a) Qual é a posição inicial do objeto? (b) Qual é a posição objeto no instante
de tempo í = 1? (c) 0 objeto passa pela origem (0,0)? (d) Faça um esboço
da trajetória do objeto.

S olução:

(a) A posição inicial do objeto é a posição que ele ocupa no instante de


tempo í = 0. Assim, para sabermos a posição inicial basta calcularmos
a(0) = ( l - F 0 , 3 - 2 - 0 ) = (l,3).

(b) Para sabermos a posição do objeto no instante de tempo í = 1 basta


calcularmos
a ( l ) = (l- t -1 , 3 - 2 . 1) = (2,1).
(c) Estamos querendo saber se existe um instante de tempo t tal que a (í) =
(1 -|- í, 3 —2 • í) = (0,0). Como o sistema
1+ í =0)
{ 3 - 2 - í = 0,
6.1 Curvas parametrizadas 189

não possui solução (verifique!), segue-se que o objeto nunca passa pela
origem (0,0).
(d) Para fazer um esboço do gráfico da curva parametrizada a vamos tentar
determinar uma equação nas variáveis x e y em que é satisfeita pelos
pontos a (t) = (1 -t- í, 3 —2 • í). Escrevendo

X = 1 + í,
y = 3 - 2 - í ,

podemos isolar isolar t na primeira equação, t = x — e substituir o


valor de t na segunda equação:

y = 3 — 2 • t = S — 2 • (x — 1) = —2 • X + 5.

Assim, 0 traço da curva a (e, portanto, a trajetória do objeto) é a reta


y = —2 • X + 5 no plano cartesiano R^. Veja a figura (6.1).

Figura 6.1: Traço da curva a{t) = (1 + í, 3 —2 • í).

Desta maneira, a trajetória do objeto pode ser descrita de duas maneiras


diferentes: (1) como o traço da curva parametrizada a (í) = (1 + í, 3 —2 • í)
e (2) como a curva de nível da função f {x, y) = 2 • x + y — b associada
ao nível 0. No primeiro caso, dizemos que estamos descrevendo a curva
parametricamente e, no segundo caso, implicitamente. a
190 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Exercício resolvido 6.2 Faça um esboço do traço da curva parametrizada

/3: R -)•
t !->■ /3{t) = (cos(í),sen(í))

S o l u ç ã o : Observe que, por exemplo, /3(0) = (cos(0),sen(0)) = (1,0) [em.


t = 0 0 móvel está na posição (1,0)], f3{ir/4) = ( cos(7t/ 4 ) , sen(7r/4)) =
(■\/2/2, V^/2) [emt = tt/4 o móvel está na posição (v ^/2 , V^/2)] e /3{tt/2) =
( cos (7t/ 2 ) , sen(7r/4)) = (0,1) [em t = tt/2 o móvel está na posição (0,1)].
Mas, ao invés de tentar obter um esboço do traço de /3 através de alguns
poucos pontos, vamos utilizar a mesma técnica desenvolvida no exercício
resolvido anterior, isto é, vamos tentar obter uma equação nas variáveis x e
y que é satisfeita pelos pontos /3(í), com í 6 R. Escrevendo

X — cos(í),
{ y = sen(í).

observamos que
= (cos(í))^ + (sen(í))^ = 1.
Desta maneira, o traço da curva /3 é a circunferência de centro na origem
(0,0) e raio 1. Veja a figura (6.2). b

Figura 6.2: Traço da curva /3(í) = (cos(í),sen(í)).


6.1 Curvas parametrizadas 191

Exercício resolvido 6.3 Faça um esboço do traço da curva parametrizada


V ■p2
7-
t i-> 7(t) = (cos(2 • t), sen(2 • t))

S o l u ç ã o : Vamos, novamente, tentar obter uma representação implícita


para os pontos 7(í), com t G M. Escrevendo
X = cos(2-t),
y = sen(2-í),
observamos que

x'^ + y‘^ = (cos(2 • t) y + (sen(2 • t)) = 1.

Desta maneira, o traço da curva 7, como a curva (3 do exercício anterior,


também é a circunferência de centro na origem (0, 0) e raio 1. Então as
curvas (3 e j são iguais? A resposta é não\ No intervalo de tempo de 0 até
2 •7T, um móvel locomovendo-se segundo a curva parametrizada j3 daria uma
única volta em torno da origem, enquanto que um móvel locomovendo-se
segundo a curva parametrizada 7 daria duas voltas completas. A diferença
está na velocidade] b

Exercício resolvido 6.4 Faça um esboço do traço da curva parametrizada


a:
t a (t) = (t^, t^)

Nem sempre é uma tarefa fácil obter a representação implícita


S o lu ção :
do traço de uma curva. Mas, felizmente, este não é o caso deste exercício.
Escrevendo
X —

y
observamos que x'^ = Assim, o traço da curva a é o
gráfico da função y = f{x) = x ’^!^ de uma variável. Veja a figura (6.3). g

Exercício resolvido 6.5 Faça um esboço do traço da curva parametrizada


(3: [0, +00) —y
t i-> (3{t) = {t • cos{t),t • sen(í)) *
192 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Figura 6.3: Traço da curva a{t) =

S olução : Vamos tentar obter uma formulação implícita para o traço da


curva parametrizada /3:
X = t- cos(í),
{
y = í-sen (í).
Como = (í • cos(í))^ + (í • sen(í))^ = e í 6 [0, +oo), segue-se que

t = v^x2 -I- y2

e, portanto,
y = V x ^ T í^ • sen ^a/ x^ -|-
/
E muito difícil obter informações geométricas a partir desta formulação
implícita. Com a experiência que ganhamos nos exercícios anteriores, va­
mos tentar obter um esboço do traço de /3 através de uma análise mais
qualitativa. Observe que

/3{t) = {t • cos{t),t • sen(í)) = t ♦(cos(í),sen(í)).

Assim, para cada t € [0, oo), a expressão (cos(í), sen{t)) representa um ponto
sobre a circunferência de centro na origem e raio 1. Observe que t repre­
senta o ângulo orientado que o segmento de reta unindo a origem (0,0) e o
ponto (cos(í), sen(í)) faz com o eixo x, Agora, como estamos multiplicando
(cos(í), sen(í)) por í, o raio deixa de ser 1 e fica sendo t e isto para este valor
de t\ Á medida que variamos o ângulo í, mudamos o valor do raio para t.
6.1 Curvas parametrizadas 193

Não é difícil de se convencer que, portanto, o traço da curva tem a forma


da espiral indicada na figura (6.4). ■

Figura 6.4: Traço da curva 0{t) = {t • cos{t)^t • sen(í)).

Exercício resolvido 6.6 Faça um esboço do traço da curva parametrizada


' y [0, “Foo) —y
t y{t) = • cos(í), • sen(í))

S olução : O traço de 7 também é uma espiral. Contudo, para 7, o raio


cresce exponencialmente com o tempo t, enquanto que para /3, do
exercício resolvido anterior, 0 raio (t) cresce linearmente. Outra diferença
é que em t = 0 temos 7(0) = (IjO) enquanto que /3(0) = (0,0). Veja a
figura (6.5). b

Até agora vimos apenas exemplos de curvas parametrizadas planas, isto


é, curvas cujo contradomínio é Vamos ver então um exemplo de uma
curva parametrizada tridimensional.
Exem plo 6.1 (H élice ) A hélice é o traço da curva parametrizada tridi­
mensional
a : R ->
í ^ a{t) = (cos(í),sen(í),<)
194 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Figura 6.5: Traço da curva 'y{t) = • cos(í),e‘/^ •.sen(í)).

que a cada instante de tempo t associa um ponto (cos(t),sen(t),í) em


Para fazer um esboço do desenho da hélice, observe que escrevendo

X = cos(í),
y = sen(í),
^ z = t,

segue-se que

+ y^ = (cos(í))^ + (sen(í))^ = 1,

isto é, as duas primeiras coordenadas de a (t) satisfazem a equação da cir­


cunferência de centro na origem e raio 1. Concluímos então que o traço da
curva a está contido no cilindro circular reto = 1 em e que a
‘‘altura” z = t cresce com o tempo t.

Assim, não é difícil de se convencer que à medida que o tempo t varia, o


ponto (x{t) descreve uma trajetória que vai se “espiralando” por sobre o
cilindro, formando o desenho de uma “mola”. -
6.1 Curvas parametrizadas 195

Figura 6.6: Traço da hélice a ( í) = (cos(í), sen (í),í).

C U ID A D O ! C U ID A D O ! C U ID A D O !

O traço de uma curva parametrizada é a imagem da função vetorial


a : / C IR e, portanto, é um objeto bem diferente do gráfico de a .
Por exemplo, o traço da curva parametrizada plana
a: R
t 1-^ a (í) = (cos(í), sen(í))

é a circunferência de centro em (0, 0) e raio 1 enquanto que o seu gráfico


é 0 subconjunto de R^

{(a;, í/, 2) G | a; = í e {y, z) = a (í)} =


{(í,cos(í),sen(í)) G t G

isto é, o gráfico de a é a hélice do exemplo anterior (veja a figura (6.7)),


com a única diferença que o eixo de ‘‘espiralamento’’ é o eixo x no lugar
do eixo z\ Como toda e qualquer função (escalar ou vetorial), uma curva
parametrizada possui um gráfico mas ele não é o objeto geométrico mais
interessante. Para uma curva parametrizada, 0 que realmente interessa
é 0 seu traço.
196 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Domínio de oc

Figura 6.7: Domínio, imagem (traço) e gráfico da curva param etrizada


a{t) = (cos(t), sen(í)).
6.2 o vetor tangente a uma curva parametrizada 197

C U ID A D O ! C U ID A D O ! C U ID A D O !

A partir de agora, é muito importante aprender a identificar quando um


desenho está representando o traço de uma curva parametrizada, um
conjunto de nível ou o gráfico de uma função!

Para encerrar esta seção, observe que podemos considerar uma curva pa­
rametrizada
a : / C M ->

como um processo de se agrupar ou representar m funções de uma única


variável ao mesmo tempo:
X\ : / (Z M —^ M x-ui: I C
t ^ xi{t) ’ t • y ^m(^)
Assim, por exemplo, a curva parametrizada /3{t) = (cos(í), sen(í)) pode ser
considerada como o agrupamento ou representação de duas funções reais de
uma única variável:
Xi: K X2 :
t ^ Xi{t) = cos{t) t X2 {t) = sen(t)

6.2 O vetor tangente a uma curva param etrizada

Seja ct{t) = {xi{t)^... ^Xm{t)) uma curva parametrizada em W^. Se o


parâmetro t representa o tempo, então x'j{t) = {dxj/dt){t) é a velocidade
instantânea da j-ésima coordenada ao longo da curva no instante t. As­
sim, é razoável denominar 0 vetor com as velocidades instantâneas de cada
componente
a ’{t) = { x [ { t),...,x ’^ {t))
de vetor velocidade da curva em t,
Se considerarmos a'(ío) um vetor em com extremidade inicial em
ao = <^(^0)5 então a'(^o) será tangente à curva em a(ío). Para ver isto,
seja hj uma seqüência de números tendendo a 0. Então a(ío + hj) é uma
seqüência de pontos sobre a curva tendendo a a(ío) ua medida que hj tende
198 Curvas parametrizadas, transformações lineares e outras funções vetoriais

a zero (veja figura (6.8)). 0 vetor deslocamento de a(ío) a{to + hj)


em pode ser escrito como a diferença

a (to + hj) - a (to). (*)


Por outro lado, os vetores da forma
q (to + hj) - q(to)

representam vetores de mesma direção que os vetores em (*), mas com


seus tamanhos modificados pois estamos multiplicando por l / h j (veja a fi­
gura (6.8)). Quando hj 0, o vetor limite será tangente à curva em q(to)
(veja a figura (6.8)). Mas este vetor limite pode ser calculado da seguinte
maneira:

q (to hj) — q(to)


lim
hj—
^O hj

= Hm ^ • ( ^a;i(ío + h j ) , X m { t o + h j)) - ^xi(ío),. . . , a;m(ío))

^l(^0 "f“ hj) 2:1 (to) ^m(^0 d" hj) ^mij^o)


= lim
hj —
^0 hj hj
O
_ f ^ 1(^0 d* hj) 2:1 (to) 2^771(to d" hj) ^m(^o)
= I lim
/ij—
>0 hi hj

= {x[{to),---,x'^{to)) = a'{to).

Assim, o vetor tangente nada mais é do que 0 vetor velocidade q'(to). Em


outras palavras, para encontrarmos o vetor tangente a uma curva parame­
trizada em um ponto to, basta derivarmos cada componente Xj(t) de q no
ponto to-

E xem plo 6.2 Considere a curva

x[t) = cos(t), y{t) = sen(í).


O traço desta, como já vimos, é a circunferência de centro na origem e raio 1.
Quanto t = 0 estamos no ponto (1, 0) e 0 vetor tangente neste ponto é

—(cos(í),sen(0) = (-se n (í),co s(í))lt= o =


t=0
6.2 o vetor tangente a uma curva parametrizada 199

Figura 6.8: 0 vetor tangente de uma curva como um limite de vetores secantes.

Este vetor encontra-se representado na figura abaixo com extremidade inicial


no ponto (x(0),2/(0)) = (IjO). Outros vetores tangentes à circunferência
também estão representados na mesma figura.
200 Curvas parametrizadas, transformações lineares e outras funções vetoriais

pm
6.3 Funções de para

Vamos agora estudar o objeto mais genérico de nosso curso: uma função
vetorial de W para :
f: £) C ^
X = (a^i, ^ y = (yi, ...,ym ) = f(x) = (/i(x ),. . . , /m(x)) ’
que a cada ponto x = (a:i,. . . , Xn) em D CW^ com n coordenadas associa o
ponto y = (j/i,. . . , ym) em Você pode pensar que uma função vetorial
f: í) C R^ ^ R’^ é uma maneira de se agrupar ou representar m funções
escalares definidas em D:
/i: D C R” -> R
(x i,. . ■,Xn) 2/1 = fl (^1) • • • ) ^rz)

f 2 -. D C R" R
(x i,.. • ) ^n) V2 = f 2{xu ...,X n )

fm- D C R" -> R


(x i,.. •) ^n) 2/m —- fni{xij • . • , Xfi
Estas m funções escalares /i, /2, • • •, /m são denominadas funções coordena­
das da função vetorial f.

Exem plo 6.3 Considere a função vetorial


f: R3 -> R2
{xu X2, Xs) ^ (2/1, 2/2) = f(^l, X2, Xs) = + ^2 + 3:3^ • X2 *0:3^ ,

que a cada tripla (xi,X 2jXs) associa o par ordenado formado pela média
aritmética e média geométrica de xi, X2 e X3. Podemos pensar f como o
agrupamento ou representação de duas funções escalares de R^ para R:
/ i: R3 R
/ \ , rf . Xi~hX2 + Xs
[XuX 2,X 3) yi = fliX u X 2,X 3) = ------- -------- ,

/2:
(xi,X 2,X 3) 2/2 = f 2 {xu X 2, X3) = ^ X i •X2 ‘ X3.
6.3 Funções de para 201

Observe que, por exemplo, f(9,9,9) = (9,9) e f(9 ,9 ,0) = (6,0). Você pre­
feriria que a média de suas notas em Cálculo II fosse feita com a média
aritmética ou a média geométrica? b

Como no caso de funções escalares, também podemos definir conjuntos


de nível de uma função vetorial:

D efinição 6.2 (C onjunto de nível) Seja f: £) c -4 uma


função vetorial de n variáveis com domínio D. Dado um ponto (nível)
k — {ku ^ , kfn) € R”^, definimos o conjunto de mvel associado a k
como o conjunto

*((íTl, j/2j » í ^n) € D I jf (íTi, X2j * * *>^n) ^ k ^ • j ^m)}" i

isto é, O conjunto de todos os pontos do domínio de / para os quais o


valor da função vetorial é k.

Representações geométricas de uma função — tais como conjunto de nível,


gráfico e traço — só podem ser feitas para dimensões muito específicas. Por
exemplo, conjuntos de nível só podem ser desenhados se n = 2 ou n = 3, o
gráfico de uma função vetorial só pode ser desenhado se n + m < 3, e assim
por diante. Mesmo assim, exemplos em dimensão baixa serão suficientes para
intuirmos resultados que, depois, mostraremos ser verdadeiros para todas as
dimensões com recursos algébricos.

Exercício resolvido 6.7 Determine o conjunto de nível da função vetorial


f: R3 R2
(x,y,z) ^ f{x,y,z) = { z - l , x ^ + y'^- 1 )
associado ao nível k = (0,0).

S olução: Queremos determinar todos os pontos (x,y,z) E tais que


í{x,y,z) = (2 — 1, + 2/^ — 1) = k = (0,0). Assim, devemos resolver 0
sistema não-linear
' z =1,
{
+ y^ = 1.
A primeira equação deste sistema descreve o plano z = 1 em e a segunda
equação descreve um cilindro circular reto e o conjunto de nível de f é a
202 Curvas parametrizadas, transformações lineares e outras funções vetoriais

interseção destas duas superfícies sendo, portanto, a circunferência + =


1 no plano z = 1 (veja a figura (6.9)). p

z= l

Figura 6.9: Interseção do plano z = 1 com o cilindro circular reto = 1.

D efinição 6.3 (F unção de classe O^) Dizemos que xima função

f D c R” -4
X H- y = f(x) = (/i{x ), ,/m (x)).

é de classe & se cada função coordenada /* é de classe conforme


a definição (5.2), Se cada /i é classe 0 (isto é, se cada f{ é contínua),
então dizemos que f é de classe (isto é, f é uma função contínua).
Se cada /j é de classe então dizemos que f é de classe C°°.

6.4 Transformações lineares

Vamos estudar agora uma classe de função vetorial muito importante: a


classe das transformações lineares. Em um certo sentido, elas são as funções
vetoriais mais simples que podemos imaginar.
6.4 Transformações lineares 203

Como veremos mais adiante, da mesma maneira que a reta tangente


aproxima uma função de uma única variável na vizinhança de um ponto,
a composição de uma transformação linear com uma translação (uma trans­
formação afim) irá aproximar uma função vetorial de várias variáveis na
vizinhança de um ponto em K".

Definição 6.4 (T ransformação linear) iUma tra n sfo rm a çã o li­


n e a r T; K" -> é uma função vfetorial definida por uma matrizi.....

O ll a i2 • ** ai^ n
«21 a22 *** ^2n .
T(®1, X2, • ■•, ®}j) — *
*
^m2 *' * ^hnn mxn

Podemos ainda escrever


n n - n \
Í.»=!
^ ] O li * X f, ^ ^ 02» * X i} • • • > ^ •, Ormi * 3!»
»=1 1=1
I >

E xem plo 6.4 Considere a transformação linear T : ^ definida por

1 2 1 • X -h 2 • y
T (x,y) : 3 4 3 • X+ 4 • y
5 6J 2x 1 5 • X -h 6 • y
3x2 J 3x 1

isto é.

T(x, y) = (1 • X -I- 2 • y, 3 • X 4- 4 • y, 5 • X + 6 • y).

Observe que as funções coordenadas de T são do tipo constante vezes variável


mais constante vezes variável. Neste sentido, transformações lineares são
funções realmente muito simples! a
204 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Exem plo 6.5 Considere a transformação linear T ; —>■R definida por

T { x , y , z ) ^ [ l 2 3 ] 1x3 (6.1)
3x1

Observe que

T(a;, z) = [1 • X + 2 • y + 3 • = l- x + 2- y + 3*z^

onde, na última igualdade, estamos identificando as matrizes 1 x 1 com


o conjunto dos números reais. Note também que a expressão (6.1) está
codificando matricialmente o produto interno dos vetores (1,2,3) e {x^y^z)
em
T(a;, 2/, 2;) = (1,2, 3) • (x, 2/, z) = 1 • a; + 2 • 2/ + 3 • z. ^

Devido à sua forma simples, uma transformação linear possui muitas pro­
priedades interessantes que as demais funções vetoriais não compartilham.
Por falta de tempo, não vamos nos deter muito no estudo destas proprieda­
des. Se você quer se aprofundar no assunto, existe uma disciplina totalmente
dedicada às transformações lineares e suas propriedades: Álgebra Linear.
Contudo, vamos destacar três propriedades interessantes:

T eorem a 6.1 (P r o peied a d b s d e um a tea n sfo k m a çâ o l in ea r )


Considere uma transformação linear T . R^ — R^ definida por

0X1 ' C L12 ' ■ *' X i

021 Ü 2 2 ' - C l2 n X 2
T { x i ,X2,.. ,a;„) = *

®ml ^m2 ' ' ' ^ m n

Se X e y são vetores em R” e e é um número real, então valem as


seguintes propriedades:
(a) T ( 0) = 0 , isto é,

== (OA V^*
n: zeros m zeros

Em outras palavras, toda transformação linear leva a origem de


um espaço na origem do outro
6.4 Transformações lineares 205

(b) T (x + y) = T(x) + T(y), isto é,

*r(^l Vlf ■ ■? 2/íi) ■“ ^ (^ 1 ) • * j ^ (í/l) * * * j Vn}*

Em outrâS palavras, calcular uma transformação linear na soma


de dois vetores é a mesma coisa que calculá-la em cada vetor se­
paradamente e, depois, somar os resultados.
(c) T ( c ' x) = c • T{x), isto é,

T ( c - x i,.. ,c-a:„) = c -T ( x i,. ,x„).

Em outras palavras, calcular uma transformação linear na multi­


plicação de um vetor por um escalar é a mesma coisa que calculá-la
no vetor separadamente e, depois, multiplicar o resultado pelo es-

Demonstração: Vamos provar apenas a propriedade (b). As outras duas


ficam como exercício. Se
x = (x i,...,x „ ) e y= (y i,...,y n ),
de modo que x -f y = ( n -Hy i,. . . , -Hy„), então

T (x -|- y) = T(xi -f yi, -f- y2,. . . , x„ -f y„) =


xi + yi Xi yi \
X2 + V2 X2 V2
A- = A- -1-

Xn Vn 1 X ji Vn /
Como a multiplicação de matrizes é distributiva, segue-se que
Xi yi \ Xi yi
X2 y2 X2 V2
T (x + y) = A - + = A- -1-A-

X ji . . ) Xn Vn

isto é, T (x + y) = T(xi, X2,. . . , x„) -h T(yi, y2,. . . , Vn) = T(x) + T(y). .

Existe uma outra propriedade muito interessante que transformações line­


ares possuem e as demais funções não possuem. Se T : R" —>■ R*" é uma
206 Curvas parametrizadas, transformações lineares e outras funções vetoriais

transformação linear e você conhece o valor de T em apenas n vetores (esco­


lhidos de uma maneira especial) então você conhece o valor de T em todos
os vetores de R” ! Para ser mais preciso, considere os vetores “especiais”
ei = (1 ,0 ,0 ,...,0 ),
62 = (0 ,1 ,0 ,...,0 ),

— (0 , 0 , 0 , , 1),

OS assim denominados vetores da base canônica de Suponha que saiba­


mos o valor de T em cada um destes vetores: T(ei), T(e2), . . . , T(e„). Se
X = (x i,. . . , x„) é um vetor qualquer de então

X = ^2j • • • 7^n)
= Xi • (1 ,0 ,0 ,..., 0) + X2 • (0 ,1 ,0 ,..., 0) + • • • + Xn • (0 ,0 ,0 ,..., 1)
= íTi • Gi ^2 • ©2 + • *• +
isto é, X pode ser escrito como uma combinação linear dos vetores da base
canônica {ei, 0 2 , , e„}.
Utilizando as propriedades do teorema (6.1) podemos facilmente calcular
o valor de T(x):

T(x) — T(2:i • ©1 “h X*2, *©2 “f" ***“h *^ri) ”


x\ • T(ei) + X2 • T(e2) + • • • + • T(e7j).
Observe que T(x) é uma combinação linear dos vetores T(ei), . . . , T(e„),
sendo que os coeficientes da combinação linear são justamente as coordena­
das xi, . . . , Xn de X. Assim, se T é uma transformação linear, para saber
o que acontece com a aplicação em um vetor x qualquer basta saber o que
acontece com a aplicação nos vetores ei, 02, . . . , 0n- Conhecer o comporta­
mento da aplicação T em apenas n vetores (escolhidos de maneira especial)
é informação suficiente para calcular a transformação linear nos infinitos
vetores de W !

E xem plo 6.6 Considere a transformação linear T : tal que


T(0i) = (1, 2,1), T(02) = (-1 ,3 ,9 ) e T(o3) = (2,3,7).
Para calcular T (l, 2, 3), observe que

(1,2,3) = 1 • (1,0,0) + 2 . (0,1,0) + 3 • (0,0,1) = 1.01 -f 2.02 + 3 • 03,


6.4 Transformações lineares 207

portanto,
T(l,2,3) = 1 • T(ei) + 2 . T( 62 ) + 3 • T(e 3)
= l . ( l , 2 , l ) + 2 . ( - l , 3 , 9 ) + 3-(2,3,7)
= (5,17,40). ,

Isto funciona apenas para os vetores ei, ..., e„ da base canônica? Não,
a técnica acima funciona para qualquer conjunto {bi,..., b„} de n vetores
em R'^, para os quais não é possível escrever um vetor como combinação
linear dos demais (na linguagem de Álgebra Linear, os n vetores devem
ser linearmente independentes). Em certas situações, muitos cálculos são
simplificados com a escolha adequada da base {bi,...,b„}. Não vamos
nos
✓ aprofundar neste tópico, que é amplamente discutido em um curso de
Álgebra Linear.
Para encerrar esta seção, vamos dar uma outra maneira de se identificar
uma transformação linear:

Teorem a 6.2 Seja T ; R'^ —>■R'” uma função vetorial de R”,paira R”*

(1) T (x + V) = T (x) 4- T (y), para todo x, y 6 R” e


(2) T (c • x) = c • T (x), para todo x € R* e c e R.
Então T é uma transformação Imear, pu seja, existe uma matriz
tal que T (x) = A ♦x.

Demonstração: Sejam ei, . . . , os vetores da base canônica de R” e consi­


dere os valores
T(ei) = (íJll, Íl21> • • • ) ^ml)j
T(e2) = (^12,^22,

T(e7i) — (Q-Iti) ^2nj • • • ) ^mn)‘


Por outro lado, x = (xi, X2,.. . , Xn) = xi • ei + X2 • 62 H------ h • e^i, de modo
que

T(x) = xi • T (ei) + • • • + Xn • T(en) =


* (^11) ^21 j • • • j <^ml) + ••*■!" X n • { a \ n j U2n? • • • j ^ m n ) j
208 Curvas parametrizadas, transformações lineares e outras funções vetoriais

“ (X/í=l ’ Xij . . .

aii ai2 •'’ * ^In Xi


(^21 022 • ■* X2
T (x) = = A-x,

^ml Om2 ■' ^mn Xji

para todo x G

6.5 Exercícios

[01] Faça a associação das seis curvas parametrizadas indicadas abaixo com
cada um dos traços na figura (6.10).
(a) a (í) = (t^ — 2 1 , —í ) ,
(b) a ( í ) = [ t ^ - l , 2 - f ) ,
(c) a (í) = (sen(3<), sen(4í)),
(d) a (í) = (í + sen(2í),í + sen(3í)),
(e) a{t) = (sen(í + sen(í)), cos(í + cos(í))),
(f) Oí{t) = (cos(í),sen(í + sen(5í)).

Observação: para cada um dos desenhos, escalas diferentes foram utili­


zadas para cada um dos eixos coordenados!

[02] Faça a associação das seis curvas parametrizadas indicadas abaixo com
cada um dos traços na figura (6.11).

(a) oc(t) = (cos(8í, í, sen(8í)),


(b) a (í) = (í2 _ l.í^í'*),
(c) a (í) = +
(d) a (í) = (sen(6í)cos(2í),sen(6í)sen(2í),í),
(e) a(f) = (cos(í),sen(í),sen(5í)),
(f) a (í) = (cos(í),sen(í),ln(í)/2).

Observação: em cada um dos desenhos, a mesma escala foi utilizada


para os três eixos coordenados, mas desenhos diferentes podem possuir
escalas diferentes.
6.5 Exercícios 209

(1) (2)

(3) (4)

(5) (6)

Figura 6.10: Traços de seis curvas parametrizadas diferentes.


210 Curvas param etrizadas, transform ações lineares e outras funções vetoriais

(1) (2)

Figura 6.11: Traços de seis curvas parametrizadas diferentes.


6.5 Exercícios 211

[03] Faça um esboço do traço das seguintes curvas parametrizadas:


(a) a{t) = (4 - 2í, 1 + í),
(b) oc{t) = (^2,^2 + 2 ),
(c) cx{t) = (2 cos(í), 3 sen(í)) <
<
(d) =
[04] Considere / : R ^ M uma função de uma única variável. Mostre que
0 gráfico de / no plano é exatamente o traço da curva parametrizada
definida por Oí{t) = (t,
[05] Um objeto move-se ao longo de um caminho de tal maneira que sua
posição no instante de tempo t é (2 t,í^ ,l + para t G [0,1]. No
instante de tempo t = 1, ele resolve seguir a reta tangente à sua tra­
jetória mantendo a velocidade que ele tinha no tempo t = 1 . Qual será
a posição de objeto no tempo t = 3?
[06] Um objeto move-se sobre 0 caminho (x,?/) = 4 í). Quais são
as coordenadas do objeto quando sua velocidade é paralela ao eixo x?
[07] Suponha que a curva parametrizada /3(t) = {t • cos{t),t • sen(í)) do
exercício resolvido (6.5) esteja definida para todo t G R. O que você
pode dizer a respeito do traço de (31

[08] Suponha que a curva parametrizada 7(t) = • cos(t), • sen(t)) do


exercício resolvido (6.6) esteja definida para todo t G R. O que você
pode dizer a respeito do traço de 7?
[09] Ache uma parametrização para cada uma das curvas abaixo, isto é, ache
uma curva parametrizada cujo traço seja igual ao conjunto indicado em
cada item.

(a) O segmento de reta que vai do ponto (0,0) ao ponto (1,2).


(b) O arco de parábola y = x ‘^ do ponto (—1,1) ao ponto (1,1).
(c) A parábola y‘^ = A x.
(d) A elipse 2 -h = 2.
(e) O segmento de reta que liga os pontos (1, 0, —2) e (1, —3,1).
(f) A interseção do cilindro x ‘^ + y‘^ = A com 0 plano z = 10 — 2x — y.
(g) A interseção do parabolóide z = x^^ + y^^ com 0 plano x + yd- z = 1 .
212 Curvas parametrizadas, transformações lineares e outras funções vetoriais

[10] (P ro p ried ad es d a derivada de um a curva p a ra m etrizad a) Sejam

curvas parametrizadas de classe definidas em um mesmo intervalo I.


(a) Mostre que (a + /3)'(t) = cx!(t) + /3^(t), para todo t G /.
(b) Mostre que se c é uma constante real, então (c • a )'(í) = c • a '(í),
para todo í G /.
(c) Mostre que s e p : / c R — uma função de uma variável de
classe então (^-a)'(t) = g\t)-ct[t) + g{t)-(x\t)^ para todo t G I.
(d) Mostre que se/i: uma função de uma variável de
classe então (a o hy(t) = h’[t) • a'(/i(í)), para todo í G /.
[11] (O com prim ento de arco de um a curva p a ra m etrizad a) Neste
exercício vamos deduzir uma fórmula para o cálculo do comprimento
(de arco) do traço de uma curva parametrizada. Vamos mostrar que se
a : / = [a, 6] C M — é uma curva parametrizada de classe então
0 comprimento de arco do traço de a é dado por

= / V ' W I I dt. (6.2)


Ja

Para isto, vamos usar a técnica de aproximar o traço de a por poligonais.


Considere uma partição do intervalo [a, b] em n subintervalos de mesmo
tamanho:

a = íq < ti < • • • < tji = b

com Aí = í i —ío = Í2—íi = • • • = tn—tn-i = {b—a)/n. Associada a esta


partição, temos uma curva poligonal obtida unindo-se pares sucessivos
de pontos a (íj) e a(íj+i), com 0 < i < n —1, sobre o traço de a (veja
a figura (6.12)).
O comprimento de arco da curva poligonal fornece uma aproximação
para o comprimento de arco da curva original. E de se esperar que
quanto mais “fina” a partição, isto é, quanto maior o valor de n, melhor
será o valor da aproximação. Mas calcular o comprimento de arco da
curva poligonal é uma tarefa fácil de se fazer: basta somar o compri­
mento de cada segmento de reta que compõe a curva poligonal. Usando
agora a fórmula para a distância euclidiana em (veja a definição (4.4)
6.5 Exercícios 213

Figura 6.12: Aproximando o traço de um a curva param etrizada por um a


curva poligonal.

na página 139), temos que o comprimento do segmento de reta que une


os pontos Oí{ti) e a(ti+i) é dado por

|| q;(íí ) - a(íi+ i)|| =


i/[x (íi+ i) - a;(íj)]2 + [?/(íj+i) - í/(íi)]2 + [z{ti+i) -

onde a{t) — {x{t),y{t),z{t)). Vamos agora usar o teorema do valor


médio (veja a referência [53]) para as funções ar, y e 2; de forma a obter
números reais r/, rf e r? no intervalo aberto (ti,ti+{) satisfazendo

ar(íi+i) - ar(íj) = x '{ t^) {U+i - U),


y{ti+i) - y{ti) = y'{r^) {U+i - u),
Z{ti+l) - Z{ti) = z'{t -) (íj+l - ti).

Logo, o segmento de reta unindoa{ti) e a(íj+i) tem comprimento

a ( í , ) - a ( í , + i ) || = M r * ) Y + W { r t ) ] ^ + {ti^, - U)
214 Curvas param etrizadas, transform ações lineares e outras funções vetoriais

e, portanto, a curva poligonal tem comprimento


n—1

i=0
onde A t = — U = (ò —a)/n. Desta maneira, o comprimento de
arco 5 da curva parametrizada ct é o limite da seqíiência Sn quando
n —> +00, se este limite existe. Como oc' é contínua, tal limite existe e
rb ________________________
s = \im Sn - \/[a;'(í]2 + [y'(í]2 + dt,
n-^+oo Ja
isto é.

l|a '(í)l|á í-
Ja
Apesar das contas acima terem sido feitas para curvas parametrizadas
em R^, não é difícil de ver que elas podem ser estendidas facilmente
para curvas parametrizadas em outras dimensões.
(a) Calcule o comprimento de arco da curva parametrizada
oc[t) = (e^ cos(t),e* sen(t)) ,
para t G [0,1].
(b) Calcule o comprimento de arco da hélice
ot(t) = (cos(t), sen(t), í),
com t e [0, 2 7t].
(c) Mostre que o comprimento de arco da elipse, definida parametrica-
mente pela expressão
a (t) = (a cos(t),6 sen(í)),
com t G [0,2 7t] e a > ò > 0, é dada por
Z‘^/2 ^-----------------
s = Aa / y l — sen^(t) dt^
Jo
onde e = \Jo? — 6^/a é a excentricidade da elipse.
(d) Use a fórmula (6.2) do comprimento de arco para a curva parame­
trizada
oc{t) = (r cos(t),r sen(í)),
com t G [0,2 7t], e conclua que o comprimento de uma circunferência
de raio r é igual a 27rr.
6.5 Exercícios 215

[12] (As geodésicas do cilindro circular reto) Desenhe uma hélice so­
bre um cilindro de cartolina, conforme indicado na figura (6.6) da
página 195. Se você cortasse o cilindro por uma reta paralela ao eixo ^
e 0 abrisse sobre uma mesa, que desenho você veria?

[13] As funções cosseno hiperbólico e seno hiperbólico são definidas, respec­


tivamente, por:
+ e
cosh(a:) = senh(a:) =
2 ' ' ^ 2

(a) Mostre que cosh^(rc) —senh^(a;) = 1, para todo a; € R.


(b) Mostre que o traço da curva parametrizada definida por

a,(t) = (a cosh(í),6 senh(í)),

com í E M e a e 6 constantes positivas, é o ramo da hipérbole

a2 62 “
no primeiro e quarto quadrantes do plano euclidiano.
(c) Mostre que a derivada do cosseno hiperbólico é o seno hiperbólico
e que a derivada do seno hiperbólico é o cosseno hiperbólico.

[14] (A ciclóide) A trajetória descrita por um ponto p sobre uma circun­


ferência, quando esta rola sem deslizar sobre uma reta fixa no plano
cartesiano, é denominada ciclóide. Suponha que a circunferência tenha
raio r e que o eixo a; seja a reta fixa sobre a qual a circunferência gira. Se
0 ponto p está na origem (0, 0) quando a circunferência está em (r, 0),
mostre que a ciclóide pode ser descrita parametricamente pela expressão

a{t) = (x(6'), y{e)^ = sen(6>)), r • (1 - cos(6»))) ,

onde o parâmetro 6 é o ângulo indicado na figura (6.13).


A ciclóide tem uma propriedade muito interessante: ela é a solução do
problema da braquistócrona [do grego, bráchistos (brevíssimo) -h chrónos
(tempo)], proposto por Johann Bernoulli em junho de 1696:
216 Curvas parametrizadas, transformações lineares e outras funções vetoriais

O PR O B L E M A DA B R A Q U IS T O C R O N A

Encontre a curva ao longo da qual um ponto material M des­


lizará sem atrito no tempo mais curto, sob a influência da
gravidade, a partir de um ponto A até um ponto Z, situ­
ado mais abaixo e fora da reta vertical que passa por A.

A resposta não é uma reta! Galileu estudou este problema antes de


Bernoulli e concluiu que o movimento sobre um arco de circunferência
é mais rápido do que aquele sobre o segmento de reta que une os dois
pontos. Contudo, ele não conseguiu estabelecer qual era a solução do
problema da braquistócrona. Muitos matemáticos responderam ao de­
safio de Bernoulli e demonstraram que, de fato, a ciclóide (“invertida”)
é a curva que resolve o problema da braquistócrona. Entre eles: Leib-
6.5 Exercícios 217

niz, Jakob Bernoulli (irmão de Johann), PHôpital e o próprio Johann


Bernoulli.
Outra propriedade interessante da ciclóide é a seguinte: não importa
onde 0 ponto material M seja colocado sobre a ciclóide “invertida” ,
ele leva o mesmo tempo para deslizar até o fundo (ponto mais baixo da
ciclóide). Portanto, a ciclóide resolve também o problema da tautócrona
[do grego, tautó (o mesmo) + chrónos (tempo)]. O físico holandês Chris-
tiaan Huygens propôs que o pêndulo do relógio (que ele inventou) de­
veria oscilar em um arco cicloidal, porque então ele levaria o mesmo
tempo para fazer uma oscilação completa por um arco maior ou menor.
Não demonstraremos estas propriedades da ciclóide aqui. De fato, elas
exigem técnicas um pouco mais sofisticadas do que aquelas que desenvol­
veremos neste curso. Indicamos ao leitor interessado no assunto o livro
Stories about Maxima and Minima de V. M. Tikhomirov (referência [77]
da bibliografia).
[15] (O v eto r aceleração de um a curva p a ram etrizad a) Se uma curva
parametrizada a : / C M -> descreve o movimento de um ponto ma­
terial, então é natural definirmos a aceleração como a taxa de variação
do vetor velocidade:

onde a (í) = (x i(í),. . . , Xyj(t)). Calcule o vetor aceleração das seguintes


curvas parametrizadas:
(a) a (í) = (4 - 2í, 1 -hí),
(b) a (í) = (í 2,í 2 + 2),
(c) Oí{t) = (2 cos(í),3 sen(í))
(d) a(t) = (í,í^í^).
Se um ponto material de massa m se movimenta em então, pela
segunda lei de Newton^ a força F que age sobre ele no ponto ct{t) está
relacionada com sua aceleração:

F (a(í)) = m.a"(í).
Em particular, se nenhuma força age sobre o ponto material, então
sua aceleração oc” é 0 e, conseqüentemente, seu vetor velocidade a ' é
constante. Sendo assim, a trajetória do ponto material é uma reta.
218 Curvas parametrizadas, transformações lineares e outras funções vetoriais

*[16] (P ro p ried ad es d a derivada de u m a curva p a ra m etriza d a ) Sejam

curvas parametrizadas de classe definidas em um mesmo intervalo I.


(a) Mostre que (a • /3)^í) = olÍí ) • /3{t) + cx{t) ■ para todo t E I,
onde • denota o produto escalar de vetores em
(b) Mostre que (a x /3 )'(í) = a '(í) x/3{t)+a{t) xl3'{t), para todo t E I,
onde X denota o produto vetorial de vetores em .
* [17] (G eo m etria diferencial de curvas p aram etrizad as) Neste exercí­
cio vamos desenvolver a teoria clássica de geometria diferencial de curvas
parametrizadas.

D efinição 6.5 (R e p ARAMEt RIZAÇÃO de uma curva) Consi­


dere uma curva parametrizada a : [o, è] C R -> de ciasse
definida em um intervalo [o, 6] Seja

h: [c ,d ]c [a,6] C R

uma função de uma variável de classe estrztamente crescente.


A curva parametrizada

0 : [c,d] C R R3
T' 0 {t ) — { a o h){r) = a(/i(r))

é denominada uma reparametnzagão de a .

D efinição 6;6 (C ürva r eg ula r ) Dizemos que uma curva par


rametrizada a : [a, 6] C R R" é regular se a é de classe e
a'{t) ff 0, para todo t E (o, 6],

D efinição 6.7 (C urva param etrizada pelo com prim ento


d e arco ) Dizemos que a : [a, 6] C R -4- R” de classe é uma
curva parametnzada pelo comprimento de arco se !la^(s)|| = 1,
para todo s E [a, ô].
6.5 Exercícios 219

(a) Mostre que se j3 é uma reparametrização de a , então ote /3 possuem


o mesmo traço e o mesmo comprimento de arco.
(b) Mostre que se a : [a, 6] C M —> R” está parametrizada pelo compri­
mento de arco, então o comprimento de arco de a é igual a 6 —a.
(c) Mostre que se a é uma curva parametrizada regular, então a função
de uma variável g: [a, 6] [0, l] definida por

s= ^9Ít)= Í
Ja
||a '(T )||á r

é de classe estritamente crescente e inversível. O símbolo I


representa o comprimento de arco de a . Seja h: [0,/] -> [a,6] a
inversa de g definida no item anterior. Mostre que h também é uma
função de classe estritamente crescente e que a reparametrização
j3 = OL o h satisfaz a propriedade

d^( .
= 1,

para todo s € [0, Z]. Moral da história: toda curva regular pode ser
parametrizada pelo comprimento de arco.

D efinição 6 .8 (O v e t o r t a n g e n t e u n it á r io ) Se uma curva


parametrizada a : [a,í>] C M é regular, então podemos
definit o vetor tangente unitário à curva <x ém a (í):

t(í)
!a'(í)|

(d) Mostre que se a : [a, 6] C K -> é uma curva regular de classe C°°,
então t'(í) • t(í) = 0 para todo t 6 [a, 6].

Com o vetor tangente unitário é possível quantificar o quanto uma curva


está “encurvada” . Observe a espiral logarítmica dada na figura (6.14).
Nela estão desenhados os vetores tangentes unitários em pontos igual­
mente espaçados, no sentido que o comprimento de arco entre dois pon­
tos sucessivos é constante. Em pontos mais próximos da origem, a espi­
ral está mais “encurvada” do que em pontos mais distantes. Note que
220 Curvas parametrizadas, transformações lineares e outras funções vetoriais

quanto mais a curva se “encurva”, mais rápida é a variação da direção do


vetor tangente unitário. A variação do vetor tangente unitário fornece,
portanto, uma medida da curvatura da curva.

Figura 6.14: O vetor tangente unitário em pontos “igualmente espaçados”


da espiral logarítmica.

D efinição 6.9 (Á curvatura ). Seja a : |a ,6] c M - f uma


curva de classé C®" parametrizada pelo compríiriento de arco. A
curvatura em um ponto <x{s) sobre o traço da curva é o número

m = l|a 'W ||,

(e) Se uma curva regular a : [a, 6] C M ->■ de classe C°° não está
parametrizada pelo comprimento de arco sabemos, pelo item (c),
que é possível reparametrizá-la pelo comprimento de arco e, com
esta reparametrização, podemos calcular sua curvatura. Contudo,
é possível estabelecer uma fórmula para a curvatura de a usando
diretamente a parametrização original. Para isto, mostre que

k(t) =
| | a '( í ) | | 3 •
6.5 Exercícios 221

( f ) Mostre que toda reta tem curvatura zero em cada um de seus pontos.
(g) Mostre que a curvatura de uma circunferência de raio r em cada
um de seus pontos é constante e igual a 1/r.
(h) Calcule a curvatura da hélice a (í) = (cos(it), sen(í), t) para t G M.
(i) Faça 0 gráfico da curvatura da parábola a (í) = ( í , p a r a í G M.
Qual é o ponto da parábola de maior curvatura? O que acontece
com a curvatura quando t +oo? E quando t —oo?

D efinição 6,10 (O. v e t o r norm al pr in c ipa l ) Considere


uma curva parametrizada a [a, 6] C R de classe
com a \ t ) ^ 0, para todo t E [a, 6]. Definimos o vetor normal
principal de ct em a (í) por* ...
a'{t)
n(í)
|a '( í) |r

(j ) Use o item (d) para mostrar que se a : [a, 6] C R — R^ uma curva


parametrizada de classe com cc'{t) ^ 0, para todo t G [a, 6],
então os vetores t(t) e n(í) são perpendiculares. Em outras palavras,
mostre que t(t) • n(t) = 0, para todo t G [a, 6].

D efinição 6.11 (O v e t o r bínorm al ) Considere uma curva


parametrizada a : [a, 6] C R —^ R^ de classeC ^ com a '(í) ^ 0,
para todo t G [a, 6]. Definimos o vetor normal hinormal de ct em
o:(í) por b(í) = t(í) x n(í).

Observe que, pelo item ( i ) e pela definição do vetor binormal, os vetores


t(t), n{t) e b(t) são unitários e dois a dois perpendiculares. Estes vetores
formam o triedro de Serret-Frenet da curva. Veja a figura (6.15).

(k) Mostre que se a : [a, 6] C R — R^ uma curva parametrizada de


classe com a \ t ) / 0, para todo t G [a, 6], então

h'{t) • b(í) = 0 e b'{t) • t(í) = 0,

para todo t G [a, 6]. Conclua que b' é um múltiplo escalar de n.


222 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Figura 6.15: Os vetores tangente t, normal principal n e binorm al n.

D e fin iç ã o 6 .12 (A torção ) Considere a ; [o, 6] C M —)• de


classe <7*® parametrizada pelo comprimento de arco satisfazendo
a '(s ) ^ 0 , pára todo s G {a, 6], A torção em um ponto a ( s )
sobre o traço d á ciirva é o número r (s ) tal que

isto é, 't (s) — —n(s) • b'(s).

(1) Seja uma curva regular a : [a, 6] C M — de classe (não neces­


sariamente parametrizada pelo comprimento de arco). Se a '(t) ^ 0,
para todo í G [a, 6]), mostre que a torção de a pode ser calculada
pela expressão
[a'{t) X a"(í)] •
r{t) =
,|a'(í) X a"(í)||2

(m) Calcule a torção da hélice a{t ) = (cos(í),sen(í),í), com í G R.


6.5 Exercícios 223

(n) Mostre que a torção de uma curva parametrizada plana (isto é, uma
curva cujo traço está contido em algum plano de E^) é zero em cada
um de seus pontos. Se a torção não é zero, então ela fornece uma
medida do quanto a curva tende a se afastar de um plano.
(o) Use o item (k) para demonstrar as fórmulas de Serret-Frenet de
uma curva parametrizada pelo comprimento de arco:
t'(5) = +k{s) ■n (s),
n'(s) = —k{s) ■t(s) -r(s) -b(s),
b'(5) = - r ( s ) • n (s).

Para terminar, mencionamos um resultado muito interessante na teoria


de Geometria Diferencial: dadas duas funções k = k{s) e r = r{s)^
com k{s) ^ 0 para todo 5, a menos de movimentos rígidos (isto é,
translações e rotações), existe uma única curva parametrizada em
cuja curvatura é k e cuja torção é r. Este resultado é conhecido como
o teorema fundamental das curvas.
[18] Diga se cada uma das funções vetoriais a seguir é uma transformação
linear ou não. Em caso afirmativo, encontre uma matriz A que satisfaz

T{x, y) = A'

e, em caso negativo, explique porque você acha que a função vetorial


em questão não é uma transformação linear.
(a) T(x, y) = {cos{x + y), sen{x - y)).
(b) T(x, y) = (sen(a; + y), sen(x - y)).
(c) T {x,y) = ( x - y , x + y).
(d) T(x,y) = (x 2 -y ^ 2 x y ).
(e) T x , y = {x,y).
(f) T x , y = {y,x).
(g) T {x,y) = {x + y ) / 2 .
(h) T(x, y) = X + y + 1.
(i) T ( x ,2/) = (0,0,0,0,0).
(j ) T (x ,y) = (x + 2 y , - x - y , 3 x + 2y).
(k) T(x, y) = {x + 2 y , - x - y , 3 x + 2 y, cos(l) x, sen(l) y).
224 Curvas param etrizadas, transform ações lineares e outras funções vetoriais

[19] Dê três exemplos de transformações lineares e três exemplos de trans­


formações não-lineares
(a) de para ' (b)de para E, (c) de R para R,
(d) de R^ para ' (e) deR'* para R^, (f) de R^ para R^,
(g) de R^ para ^ (h) deR para R^, (i) de R^ para R®.
[20] Sabendo que T : ^ —y é uma transformação linear, T (l, 0) = (2,2)
e T (0 ,1) = (0,1), calcule T(4, —3).
[21] Mostre que existe uma única transformação linear T : R^ —)• R^ tal que
T (l,0 ) = (2 ,2 )e T (0 ,1 ) = (0,1).
[22] Exiba explicitamente duas funções F j : R^ —>• R^ e F2: R^ -> R^ tais que
F i(l, 0) = F2(1, 0) = (2,2) e F i(0 ,1) = F2(0,1) - (0,1), mas Fi 7^ F2.
[23] Seja T : R^ —>• R^ uma transformação linear tal que
T (l, 1,1) = (1,0,0), T (l, 0,1) = (0,0,1) e T (l, 1,0) = (0,1,0).
(a) Calcule T (l, 0,0), T (0 ,1,0) e T (0 ,0,1).
(b) Encontre uma matriz A tal que

T { x ,y ,z) = A

(c) Calcule T (l, 2,3).


[24] Considere F : R^ -> R^ definida da seguinte maneira: se p G R^, então
F(p) é a reflexão de p com relação ao eixo x. A função F é linear?
Justifique sua resposta! Em caso afirmativo, encontre uma matriz A tal
que F(p) = A - p .
* [25] Considere F : R^ —>■R^ definida da seguinte maneira: se p € R^, então
F ( p )é a rotação de p de ângulo 0, no sentido anti-horário, em relação
à origem. A função F é linear? Justifique sua resposta! Em caso
afirmativo, encontre uma matriz A tal que F(p) = A - p.
[26] Complete a demonstração do teorema (6.1).
[27] Sejam T : R^ R^ e S: R^ ^ 1 transformações lineares e c uma
constante real. Mostre que T + S : R”^ e c • T : R^ —> R^ também
são transformações lineares.
6.5 Exercícios 225

[28] Seja T : —)►M uma transformação linear. Mostre que se T 7^ 0, isto é,


se existe x G tal que T(x) ^ 0, então T não possui extremos globais.
* [29] Mostre que uma transformação linear T : leva cada reta de
R” em uma reta ou em um ponto de W^.
[30] Mostre que a média aritmética M (xi, 2 : 2 , , Xn) = {xi+X 2 -\----- \-Xn)/n
é uma transformação linear definida em 'MP.
[31] Considere a função vetorial

F:
(x ,y ,z) !->■ F {x,y,z) = {z - - y ‘^ ,z + x'^+ y'^) '
Determine os conjuntos de nível de F associados respectivamente aos
níveis (0,0), (—1,1), ( - 1 ,- 1 ) , (1 ,-1 ) e (1,1). Faça um esboço do
desenho destes conjuntos de nível em
[32] Considere a função vetorial

F: ->■
(x,y,z) H4- F {x,y,z) = {x^ + y'^ + z '^ ,z ^ -x '^ -y '^ ) '

Determine o conjunto de nível de F associado ao nível (1, 0). Faça um


esboço do desenho deste conjunto de nível em R^.
[33] (C oordenadas polares) Considere a função vetorial
Fi R X [o,-j-oo) —y R^
(0,r) (x,y) = F{ 6,r) = (rcos(0),rsen(0)) ‘

#P

Figura 6.16: Coordenadas polares e cartesianas.


226 Curvas parametrizadas, transformações lineares e outras funções vetoriais

(a) Mostre que F leva os pontos da reta r = c (no plano 0r), com c uma
constante > 0, em pontos da circunferência de centro na origem e
raio c (no plano xy),
(b) Mostre que F leva os pontos da reta 9 = c (no plano 0r), com c
uma constante, em pontos da semi-reta que passa pela origem e tem
inclinação tg(c) (no plano xy),
(c) Conclua que a função F leva os pontos do retângulo [0, 6*] x [0, r*]
(no plano 9r) nos pontos do setor circular delimitado pelas retas
y = 0, y = tg(0*) X e a circunferência = (r*)^ (no plano xy)^
conforme a figura abaixo.

Em particular, conclua que a função F leva os pontos do retângulo


[0,27t] X [0, r*] (no plano 9r) no disco de centro na origem e raio r*
(no plano xy).
Esta propriedade de F transformar retângulos em setores circulares
será útil no cálculo de integrais duplas, assunto que você verá no
curso de Cálculo Integral de Funções de Várias Variáveis.

Os números 6 e r que satisfazem as relações x = rcos{9) e y = rsen{9)


são denominados as coordenadas polares do ponto (a;, y).

*[34] (C oordenadas esféricas) Considere a função vetorial

F! [o, H~oo) X M. X M —y
ÍP,<P,0) ^ ( x , y , z ) = F{p, <f, 9)

definida por

F{p,(p, 6) = {psen{ip)cos{0),psen{(p)sen{9),pcos{d)).
6.5 Exercícios 227

(a) Encontre (p, 9) G [0, oo) x R x M tal que F(p, (p, 9) = (1,1,1).
(b) Mostre que F leva os pontos do paralelepípedo [0, p*] x [0, 27t] x [0, tt],
no sistema de eixos p(p0, em pontos da esfera “sólida” de centro na
origem e raio r*, no sistema de eixos xyz.

Figura 6.17: Coordenadas esféricas.

Esta propriedade de F transformar paralelepípedos em esferas será


útil no cálculo de integrais triplas, assunto que você verá no curso
de Cálculo Integral de Funções de Várias Variáveis.

Os números p, (p e 9 que satisfazem as relações x = psen((p) cos(0),


y = psen((p) sen(0) e z = pcos{9) são denominados as coordenadas
esféricas do ponto {x^y^z).

'[35] (C oordenadas cilíndricas) Considere a função vetorial

F: [0,+ o o ) x R x R -> R^
(r,9,z) ^ {x,y,z) = F{r,9,z)
definida por

F(p, (p, 0) = F(r, 0, z) = (rcos(0),rsen(0),^).

(a) Encontre (r, 0, z) G [0, +oo) x R x R tal que F(r, 0, z) = (1,1,1).


(b) Mostre que F leva os pontos do paralelepípedo [0, r*j x [0, 27t] x [0, z*]^
no sistema de eixos r9z^ em pontos do cilindro “sólido” de raio r* e
altura z*, sobre o eixo 2:, no sistema de eixos xyz.
228 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Esta propriedade de F transformar paralelepípedos em cilindros será


útil no cálculo de integrais triplas, assunto que você verá no curso
de Cálculo Integral de Funções de Várias Variáveis.

Figura 6.18: Coordenadas cilíndricas.

Os números r^9 e z que satisfazem as relações x = r cos{9) e y = r sen(0)


são denominados as coordenadas cilíndricas do ponto {x^y^z).

[36] (C am pos vetoriais) Um campo vetorial em é uma função

F: D c R ^ ^ R ^ ,

definida em um subconjunto í? de R^, que a cada ponto x em D associa


um vetor F(x) em R^. Como toda função, um campo vetorial possui
gráfico, conjuntos de nível, etc. Contudo, a representação geométrica
mais interessante de um campo vetorial é aquela que, para cada ponto x
em D, representa F(x) como um vetor com extremidade inicial em x.
Para o campo vetorial dado por

F: R2 ^ R2
(x,y) F{x,y) = { -y ,+ x )

temos, por exemplo, que F(+9, —6) = (+6,+9). Desta maneira, no


ponto p = (+9, —6), desenhamos o vetor F(p) = (+6,+9), com extre­
midade inicial no ponto p = (-1-9, —6). Se repetirmos este processo para
6.5 Exercícios 229

outros pontoSj obtemos a figura (6.19) (para facilitar a visualização, o


tamanho de cada vetor foi reduzido para 15% do tamanho original).

Figura 6 .1 9 : Representação geométrica do campo vetorial ¥ { x , y ) = (—?/, H-x).

(a) Faça a associação dos quatro campos vetoriais indicados abaixo com
cada uma das representações geométricas na figura (6.20). Ob­
servação: para facilitar a visualização, os vetores nesta figura estão
representados com escalas diferentes.
(1) F{x,y) = (0,1),
(2) F(x, y) = (ln(l + + y‘^ ),x),
(3) F{x,y) = (y,x),
(4) F(x, í/) = (2 X - 3 y, 2 X + 3 y).
(b) Faça uma representação geométrica análoga à da figura (6.19) do
campo vetorial F(x, y) = {+x, +y).
(c) Faça uma representação geométrica análoga à da figura (6.19) do
campo vetorial F(x,y) = (—x, —y).
(d) Faça uma representação geométrica do campo vetorial
F{x,y,z) = (+x,+y,+z).
Observe que, desta vez, o seu desenho deve ser feito no espaço e não
no plano euclidiano!
230 Curvas parametrizadas, transformações lineares e outras funções vetoriais

\ \ \ ^ -
, ^ / / / /
X W ' ' - , . f t ! !
\ \ \ V ^ . ( t i l _
1 1 t ' ' 0 V N \ \ \ "
/ / / / ^ 1
^ V \ \ \
/ / / / - i
^ v W \

Figura 6.20: Representação geométrica de quatro campos vetoriais diferentes.

Mas por que esta representação geométrica é interessante? Você pode


pensar, por exemplo, que o campo vetorial F modela a velocidade de
um ponto material. Mais precisamente, F(x) representa o vetor velo­
cidade que o ponto material teria se estivesse ocupando a posição x.
Neste contexto, cada seta na figura (6.19) representa o vetor velocidade
que o ponto material teria se estivesse ocupando a posição indicada
pela extremidade inicial da seta. Assim, ainda com relação ao campo
vetorial F(x,j/) = {—y^+x) da figura (6.19), devemos ler a relação
6.5 Exercícios 231

F(+9, —6) = (+6, +9) da seguinte maneira: a velocidade do ponto ma­


terial na posição p = (+9, —6) no plano cartesiano é v = (-t-6, +9).
Esta interpretação nos leva à seguinte pergunta: a partir das veloci­
dades^ isto é, a partir do campo vetorial F, é possível determinar a
trajetória do ponto material? Mais precisamente, dado um campo ve­
torial F, é possível calcular uma curva parametrizada

ol: I

cujo vetor tangente cx'{t) seja igual ao valor do campo F em a (í), para
cada t ^ I I Algebricamente, a deve satisfazer a equação (diferencial)

a '( í) = .F ( a ( í) ) .

Uma curva com esta propriedade é denominada uma curva integral^


linha de fluxo ou integral primeira do campo F. Por exemplo, é fácil de
ver que, para cada r > 0, a curva parametrizada

ol(í ) z=
z (r cos(t),rsen(í))

é uma curva integral do campo vetorial ¥{x^y) = (—y,-fx), uma vez


que

Oi[t) = (—r sen(í),+ r cos(t)) = F (r cos(t),r sen(t)) = F(a(it)),

para todo t G M. De fato, pode-se mostrar que as curvas integrais de


¥[x^y) = (—y, +x) são circunferências (veja a figura (6.21)).
Além de velocidades, campos vetoriais podem ser usados para se mo­
delar fluxos de calor, campos gravitacionais, populações de espécies em
um ecossistema, etc. Muitas leis da Física, Economia e Biologia são
modeladas com campos vetoriais. No curso de Cálculo IV (Equações
Diferenciais e de Diferenças), você estudará esta teoria com mais deta­
lhes: questões de existência e unicidade de curvas integrais bem como os
vários métodos usados para se calcular as curvas integrais de um campo.
A figura (6.22) mostra algumas curvas integrais do campo vetorial de­
finido por
F(x,y) = (sen(í/),a;^-y),
geradas numericamente pelo programa Java Microscope dos professo­
res Shannon Holland e Matthias Kawski, da Universidade Estadual do
Arizona.
232 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Figura 6.21: Curvas integrais do campo vetorial F (x ,y ) = (—y, -\-x).

Figura 6.22: Algumas curvas integrais do campo F (x ,y ) = (sen(y),rc^ — y)


geradas numericamente por com putador.
6.5 Exercícios 233

(e) Mostre que a (í) = ln(|í|), 1/í), para t 7^ 0, é uma curva integral
do campo vetorial F(a;, y, z) = (2 x, z, z’^).
(f) Mostre que a{t) — —1, VÍ), para í > 0, é uma curva integral
do campo vetorial F(a:, y, z) = {y + 1, 2,1/(2 z)).

[37] (Superfícies param etrizad as) Na seção (6.1) vimos que, em algu­
mas situações, podemos representar uma curva de duas maneiras: im­
plicitamente (isto é, como um conjunto de nível de uma função escalar
/ : Z) C -> M) ou parametricamente (isto é, como a imagem de
uma função vetorial a : / C M ^ R^). Nos exercícios do capítulo 3
vimos alguns exemplos de superfícies definidas implicitamente: planos,
elipsóides, cones, hiperbolóides elípticos de uma e duas folhas, etc. Cada
um destes objetos geométricos foi definido como o conjunto de nível de
uma função escalar / : í) C R^ —> R apropriada. Agora, como no caso
de curvas, também podemos representar superfícies parametricamente,
isto é, como a imagem de uma função vetorial $ : C R^ — R^. Mais
especificamente, uma superfície parametrizada é uma função vetorial

$: C R^ ^ R^
{u,v) (a:,y,^) = $('u,'u) = ($i(u,?;),<í>2(u,'y),í>3(u,í;))

cujo domínio é um retângulo R = [a, b] x [c, d] do plano euclidiano e 0


contradomínio é R^. As variáveis u e v são denominadas de parâmetros
da superfície parametrizada $ e a imagem S = ^ { R ) da região ií, pela
função de superfície correspondente à função $ . Veja a figura (6.23).
234 Curvas parametrizadas, transformações lineares e outras funções vetoriais

Como no caso de curvas parametrizadas, o objeto geométrico mais im­


portante de uma superfície parametrizada é sua imagem S = ^{R)-
Costuma-se também dizer que ^ é uma parametrização da superfície S.
Observe que, se fixarmos um valor para o parâmetro digamos, v =
então a superfície parametrizada $ induz uma curva parametrizada.
a : [a, 6] C
u !-)► a (u ) = $(n,í;o) = ’
definida no intervalo [a, b] e cujo traço está contido na superfície S =
Analogamente, se fixarmos um valor para o parâmetro u, diga­
mos, u = uq^ então ^ induz uma outra curva parametrizada,
(3: [c, d] c R
V / 3( í ;) = ^ 2(^0,'?^ ), ^ 3 ( ^ 0 , ’

definida no intervalo [c, d] e cujo traço também está contido na su­


perfície S. Estas curvas são denominadas de curvas coordenadas da
superfície param etrizada^. Veja a figura (6.24).

Figura 6.24: Curvas coordenadas de um a superfície param etrizada.

As curvas coordenadas de uma superfície parametrizada $ são espe­


cialmente úteis para se construir um esboço da superfície S = ^ {R )
correspondente. Por exemplo, considere a superfície parametrizada

^{u^v) = (cos(n), sen(u), t;)

definida no retângulo ií = [0, 2 tt] x [0, 8]. Para cada v = vq ^ [0, 8] fixo.
6.5 Exercícios 235

0 traço da curva coordenada


oc{u) = ^{u,vo) = (cos(u),sen(u),'i;o)
é a circunferência no plano z = vq^ de raio 1 e centro em (0, 0, i?o)- Ana­
logamente, para cada u = uq G [0, 2 tt] fixo, o traço da curva coordenada
p{v) = ^ ( u o ,v ) = (c o s(u o ),se n (u o ),v )

é o segmento de reta paralelo ao eixo z, cujas as extremidades são


(cos(uo),sen(uo),0) e (cos(uo),sen(uo),8). Juntando todas estas in­
formações, não é difícil ver que a superfície S = $([0,2 7t] x [0,8]),
correspondente à parametrização é um cilindro. Veja a figura (6.25).

Figura 6.25: = (cos(n),sen(it),u) é um a param etrização do cilindro


{(a;, y, z) 6 I f{x, y, z)= x ‘^ + y‘^ = 1}.

Assim, $ (u , u) = (cos(n),sen(u),u) é uma parametrização (ou repre­


sentação paramétrica) do cilindro
{{x,y,z) € I + = 1}.
Note que este mesmo cilindro admite uma representação implícita^ isto
é, ele pode ser descrito como a superfície de nível tü == 1 da função
/: —> M definida por w = /(x , y, z) =
236 Curvas parametrizadas, transformações lineares e outras funções vetoriais

(a) Faça a associação das quatro parametrizações indicadas abaixo com


cada uma das superfícies na figura (6.26). Não esqueça de apresen­
tar alguns motivos para a sua escolha.
(1) v)= [u —u^/3 + — V —v ? v + u^/3, v ? — com (u, v )
no retângulo [—2,2] x [—2,2].
(2) = (ucos(u),tísen(u),u), (u,u) C [0,5] x [0,3 7t].
(3) = {uv,u,v'^), {u,v) e [-1,1] x [-1,1].
(4) ü) = {u cos{v), u sen{v), V cos{u)), (u,v) 6 [—4,4] x [0, 2 7t].

Helicóide Parafuso de Steinbach

Superfície de Enneper

Figura 6.26: Q uatro superfícies.


6.5 Exercícios 237

(b) Mostre que ^{u^v) = (sen(u) cos(u), cos(u) cos(u), cos(u)), com va­
lores de {ujv) no retângulo [0,7r] x [0, 2 7t], é uma parametrização
da esfera:

{(a:, y, z) G | /(x , y, z) = = 1}.

Identifique as curvas coordenadas de


(c) Mostre que ^{u^v) = (íxcos(u) ,usen(u),w), com valores de (u,u)
no retângulo [0,8] x [0, 2 tt], é uma parametrização do cone:

{(a;, y, z) G | f{x^ y^z) = x^ + y‘^ — z^ = Q com 0 < 2: < 8}.


Identifique as curvas coordenadas de
(d) Considere o toro definido no exercício [42] da página 119:

{(x, y, z) e I (x^ + y^ + z^ + - 4 (x^ + y^) = 0}.

Mostre que

$ (u , v) = ((i? —r cos(u)) cos('u), {R — rcos(u))sen(^i),rsen(u)),

com valores de {u^v) no retângulo [0,2 7t] x [0,2 7t], é uma parame­
trização do toro. Identifique as curvas coordenadas de Compare
com as curvas sobre o toro da figura (6.27).

Figura 6.27: O toro.


238 Curvas parametrizadas, transformações lineares e outras funções vetoriais

[38] Seja / : ií C R uma função de duas variáveis definida em um


retângulo R do plano euclidiano. Mostre que
^{ u, v) = {u, v, f{u, v)),

com valores de {u, v) no retângulo R, é uma parametrização do gráfico


de /:
{(x, y, z) e R^ I (x, y) e M e z = /(x , y)}.
Identifique as curvas coordenadas de Observe que o gráfico de /
também admite uma representação implícita:
{(x, y, z) € R^ I (x, y) e R e F{x, y,z) = z - /(x , y) = 0}.
Compare com o exercício [23], da página 112 do capítulo 3, item (d).

[39] Considere as funções


a: /: M R
t ^ cx{t) = {t\t^) X y = f [ x) = *

(a) A curva parametrizada a é de classe C^?


(b) A função f é de classe
(c) Verdadeira ou falsa? Se o traço de uma curva parametrizada cc de
R para R^ possui um ‘‘bico”, então a não é de classe

6.6 Leitura suplem entar

Para uma excelente coletânea de aplicações de conjuntos de nível (como,


por exemplo, a projeção de curvas sobre superfícies em engenharia de
aviação), indicamos o artigo:
1. T. A. Grandine, Applications of Contouring^ SIAM Review, vol. 42,
no. 2, pp. 297-316, 2000.
Para saber mais sobre o uso e o cálculo numérico das representações
paramétrica e implícita de curvas e superfícies em computação gráfica,
indicamos o livro:
2. C. Bajaj, J. Blinn, J. Bloomenthal, M. Cani-Gascuel, A. Rockwood,
B. Wyvill e G. Wyvill, Introduction to Implicit Surfaces, Morgan-
Kaufmann, 1997.
Capítulo 7

Aproximação linear e a regra da


cadeia

Neste capítulo vamos ver que, sob certas condições, é possível aproximar
uma aplicação f: -> R’^ não-linear “complicada” na vizinhança de um
ponto p por uma aplicação bem mais “simples”: uma função afim, que é a
composição de uma translação com uma transformação linear. Esta trans­
formação linear é o objeto em Cálculo II, equivalente ao conceito de derivada
estudada em Cálculo I e desempenhará um papel fundamental em toda teo­
ria que vamos desenvolver. Analisando as propriedades da matriz que define
esta transformação linear (algo supostamente mais fácil de se fazer) será
possível concluir propriedades muito importantes da função original. Vamos
começar com funções de R para R, seguindo depois para funções de R^ para
R, de R^ para R, de R’^ para R e, íinalmente, de R’^ para R”^.

7.1 Lembrando Cálculo I: a equação da reta tangente

Você aprendeu em Cálculo I que a reta tangente é a “melhor” reta que


aproxima o gráfico de uma função / : R —)►R na vizinhança /
de um ponto p.
Mas em que sentido uma reta é “melhor” do que outra? E preciso estabelecer
um critério para fazer uma escolha entre as infinitas retas que existem no
plano cartesiano. Se y = l{x) = a + (3 • x é a>equação de uma reta, então
queremos duas coisas: (1) que l{p) = /(p), isto é, que I e / coincidam no
ponto X = p e (2 ) que l'{p) = /'(p), isto é, que as derivadas de I e f também
coincidam no ponto x = p. Se / é de classe então existe uma única
reta I que atende a estas duas condições, a reta tangente ao gráfico de / no
ponto p.
240 Aproximação linear e a regra da cadeia

Figura 7.1: A reta tangente ao gráfico de uma função / de uma variável no ponto p.

T eorem a 7.1 (A EQUAÇÃO DA RETA t ANGENTe ) Considere nma


função / : D C E R de classe e p nnx ponto do interior de D.
Então existe tuna única reta I que satisfaz as condições l{p) = /(p ) e

V ~ í{®) = /(p ) + f í p ) ■ ~ p)-


Mais ainda, vale que

isto é, a diferença entre f ( x ) e l{^) vai para zero mais rapidamente do


que X “ p.. Bm outras palavras,

/(®) = /(p ) + / '( p ) ' (a? - p) + R{p, x), com lim = q.

Demonstração: Se l(p) = f{p) então a + P *p = /(p), isto é,


Oi = f { p ) ~ ^-P-
7.1 Lembrando Cálculo I: a equação da reta tangente 241

Por outro lado, como l'{p) = f{ p ) e l'{p) = ^ segue-se que

/3 = f \ v ) -
Desta maneira,

l{x) = a + /3 ■X = f{p) - 0 -p + P ■X =
f{p) + / 3 - { x - p ) = f[p) -I- f { p) ■{x - p).

Esta é a equação da reta tangente ao gráfico de / no ponto x = p. Final­


mente, observe que

lim /(^ ) ~ ^ f { x ) - f{p)- f'{p)-{x-p) ^


x-^p X —p x- ^p X —p

lim ( / W z .Z M _ = /-(p) _ y-(p) = 0.


X-^P \ X —p

Em outras palavras, este teorema nos diz que é possível aproximar uma
função / de classe na vizinhança de um ponto p pela equação da reta
tangente l{x) — f{p) + f \ p ) ' {x—p) (uma função afim) e que o erro ií(p, x) =
f[x) — l[x) cometido nesta aproximação tende a zero mais rapidamente do
que x —p. Mais formalmente,

f{x) = f{p) d- f'{p) - { x - p ) +R{p, x),


l{x)
R(p,x) f (x) — l(x) ^
com hm = hm -----— = 0.
x-^p X —p x^p X —p

Podemos reescrever estas expressões em termos da “pertubação” h = x —p


com relação ao ponto p de modo que x = p + h e

f {p + h) = f{p) + f'{p) ■h + R{p, h), com lim = o. (7.1)


h-^0 h

Exem plo 7.1 Seja f{x) = e^. A equação da reta tangente ao gráfico de /
no ponto p = 0 é dada por

y = l[x) = /(O) + /^(O) • {x — 0) = •X = 1+ X.


242 Aproximação linear e a regra da cadeia

Desta maneira,
.. i?(0,x)
= 1 + X + -fí(O) 2^)) com lim ---------= 0.
X

Podemos usar l{x) (uma função mais simples) para estimar o valor de /(x ),
para x próximo de 0. Por exemplo, em x = 0.2 temos /(0.2) = 1 + 0.2 = 1.2,
enquanto que /( 0 .2) = = 1.22140 .... a

A equação (7.1) pode ser reescrita como

f {p + h ) ~ f{p) = f { p) ■h +R{p, h)
V{h) T{h)

e ela nos diz que a variação V{h) = f ( p + h ) — f{p) do valor da função / no


ponto x = p pode ser aproximada pela transformação linear
T:
h ^ T{h) = f { p ) - h
e que o erro i?(p, h) = V{h) —T[h) cometido nesta aproximação tende a zero
mais rapidamente do que h. A matriz associada a esta transformação linear
é dada por
^df
dx:ip) 1x1
e ela pode ser identificada com o número real {df /dx)[p).
No caso de funções de uma variável parece não haver ganho substancial em
se pensar em transformações lineares e matrizes quando falamos de derivadas.
Contudo, como veremos a seguir, esta formulação permitirá a generalização
do conceito de aproximação linear para funções vetoriais.

7.2 Aproxim ação linear em Cálculo II

Funções escalares de 2 variáveis: a equação do plano ta n g en te

Vamos começar com o caso mais simples: sejam z = f{x^y) uma função
de duas variáveis de classe e p = (a, 6) um ponto do interior do domínio
de / . Qual é o “melhor” plano que aproxima o gráfico de / na vizinhança
do ponto p? Novamente, é preciso estabelecer um critério. Se 2: = l{x^y) =
7.2 Aproximação linear em Cálculo II 243

Q' + /3*x + 7 * y é a equação de um plano, então queremos duas coisas: (1)


que /(p) = /(p ), isto é, que I e / coincidam no ponto p = (a, h) e (2) que

dl . . df . . dl . , d f , \

isto é, que as derivadas parciais de Z e / também coincidam no ponto p.


Se / é de classe então existe um único plano I que atende a estas duas
condições, o plano tangente ao gráfico de / no ponto p.

Figura 7.2: O plano tangente ao gráfico de um a função / de duas variáveis no ponto p.

T eorem a 7.2 (A B Q U A Ç Ã a DO plano t a n ô b n t b ) Considere uma


função /* D C M de classe (7^ e p = (a, h) um ponto do interior
de D Então existe um único plano I que satisfaz as condições Z(p) =

dl, . ( \ dl, , df, ,

jp ili|f c |||||||||||Í I ||j|||^


244 Aproximação linear e a regra da cadeia

Z = l{x, y) = f{a, b) + |^ ( a , b ) - { x ~ a ) + ~ { a , b) ( y - b ) .

Mais ainda, vale que


^ f{x,y)-l{x,y) '
{x,y)-i{a,b) 11(x — a, 1/ — 6) 11 ^ (a ; — a)2 + (y — b)^

isto é, a diferença entre f{x, y) e i(x, y) vai para zero mais rapidamente
do que ||(x - n, —6)||. Em outras palavras,

/(®. y) = /(o> í>) + 6) - (x - a) + -{y - &) + X, y),

i?(g, b, X, y)
com lim = 0
(a,í()-K(a,è) y^(x - a)^ + (y -

Demonstração: Se /(a ,6) = / ( a , 6) então a + /3'U + 7'í> = /(u,í>), isto é,


a = /(a , b) —^ • a — j • b.

Por outro lado, como


d l. . d f, d f, „
y^{a,h) = ^ ( a , h )

segue-se que

Desta maneira, substituindo os valores de a, /3 e 7 na expressão de I vemos


que

/(x,y) = a + d - x + 7 - y
= f { a , b ) - P - a - ' y - b + ^ - x + ' y-y
= /(a , 6) + ^ • (x - o) + 7 • (y - 6)

= /(«> 6) • (x - o) + (a, 6) • (y - 6).

Esta é a equação do plano tangente ao gráfico de / ho ponto p = (a, 6).


Resta mostrar que esta equação satisfaz a propriedade
7.2 Aproximação linear em Cálculo II 245

f{x,y)-l{x,y)
li„. = 0.
( i,y ) - > ( a ,6 ) 11 (x —a, y —6 ) 11 (x,y)^(a,b)
Desta vez, a demonstração é um pouco mais sofisticada e requer o uso do
teorema do valor médio para derivadas. Não vamos fazê-la aqui. Uma de­
monstração completa deste teorema pode ser encontrada na referência [71],
página 833. b

Em outras palavras, este teorema nos diz que é possível aproximar uma
função / de classe de duas variáveis na vizinhança de um ponto p = (a, 6)
pela equação do plano tangente l{x,y) = /(a , 6) + {df/dx){a^ b) • {x — a) +
{df/dy){a^ b)-{y —b) (uma função afim) e que o erro i?(a, 6, x, y) = /(x , y) —
l{x^y) cometido nesta aproximação tende a zero mais rapidamente do que
||(x —a, 2/ —6)||. Mais formalmente,

f {x, y) = f{a, b) + • {x - a) + ^ { a , b ) ■{y - b) +R{a,b,x,y),

Kx,y)
com
R{a,b,x,y) f{x,y)-l{x,y)
(x,y)^{a,b) \\{x - a, y - b)\\ (x,y)-^{a,b) 11(x - O , J/ - 6 ) 11
Podemos reescrever estas expressões em termos da “pertubação” {hi, /12) =
{x — a,y — b) com relação ao ponto p = (a, 6), de modo que x = a + /ii,
í/ = 6 + /i2 e

f{a + h\,b + /12) = f{a, b) + • /ii + ^) ’ ^2 + R{a, b, h\, h2),


R ía.b.hi.hi) ^
com hm —— ——- = 0. (7.2)

Exem plo 7.2 No exemplo (5.1), página 167, estudamos a função de produ­
ção Cobb-Douglas
= f{x, y) = 4- x^/'* • y^^^.
A equação do plano tangente ao gráfico de / no ponto (a, 6) = (10000,625)
é dada por
z = /(x,y) = /(10000,625)+
df df,
(10000,625) • (x - 10000) -b ^(10000,625) • {y - 625).
246 Aproximação linear e a regra da cadeia

Mas, conforme os cálculos feitos no exemplo (5.1), /(lOOOO, 625) = 20000,


(9//ôx)(10000,625) = 1.5 e (ôZ/ô?/)(10000,625) = 8, logo
z = l[x, y) = 20000 + 1.5 • {x - 10000) + 8 • (y - 625) = 1.5 • a: + 8 • ?/.
Podemos usar l{x^y) (uma função mais simples) para estimar o valor de
P^ra {x,y) próximo de (10000,625). Por exemplo, em (x,y) —
(10010,623) temos /(10010,623) = 1.5 • 10010 + 8 • 623 = 19999, enquanto
que /(lOOlO, 623) = 19998.967.... .

Suponha que um certo fenômeno de interesse seja modelado por uma função
z = f{x^y). Em experimentos, os valores de x e y são amostrados com um
certo erro percentual. Uma pergunta muito natural é o quanto estes erros
afetam o valor z da função. A equação do plano tangente é uma ferramenta
bastante útil para se estimar este erro. Vamos ver como esta técnica funciona
em um exemplo.
E xem plo 7.3 Considere um balão meteorológico que é liberado ao nível
do mar, a uma distância d do olho de um furacão. Sua altitude aumenta à
medida que ele se move em direção ao olho. A altitude h que o balão atingirá
quando ele estiver no olho do furacão pode ser modelada pela relação
0
h 7T •5* "2’ (7.3)

onde g é uma constante gravitacional e c é uma medida meteorológica deno­


minada circulação da velocidade do vento (a circulação está estreitamente
relacionada com a intensidade e a direção dos ventos no interior do furacão).

Supondo que os erros percentuais máximos nas medidas de d e h se­


jam, respectivamente, ±2% e ±5%, vamos utilizar a equação do plano tan­
gente para estimar o erro máximo no cálculo da circulação c. Observe que a
relação (7.3) define c como uma função de d e h:

c = f{d, /j) = 7T •

A equação do plano tangente ao gráfico de z = f{x^y) no ponto (d*,/i*) é


dada pela expressão

i{d, h) = f { d \ h*) + ^ { d * , h*) ■{d - d*) + ^ { d * , h*) ■{h - h*).


7.2 Aproximação linear em Cálculo II 247

Se (á, h) está próximo de (d*, h*) então l { d , h) fornece uma boa aproximação
de /(d, h) e, portanto, a variação AZ(d, h) = Z(d, /i) —/(d*, /i*) fornece uma
boa aproximação para o erro (absoluto) A f { d , h) = /(d , h) —f { d * , h*). Sendo
assim,

A /(d, h) « Al{d, h) = h*) ■{d - d*) + (d*, /i*) • (/i - h*).

Agora, derivando a função / com relação a d e /i no ponto (d*, /i*) obtemos,


respectivamente.

Í.-Í = »V2 1

Desta maneira, escrevendo Ad = d — d* e A h = h — h*, segue-se que

2 d* T '"'^*''2
A /(d, /i ) « A Z(d,/i)-7T -5i/2.
(/i*)i/2 ■ ■2 ■2 (/i*)3/2 ■

Como estamos interessados em estimar o erro percentual, vamos dividir esta


expressão por /(d*, h*) (que é igual a Z(d*, /i*)), de modo que

Af {d, h) ^ Al{d,h) ^
f{d*,h*) ~ l{d*,h*) ~ ' d* ~ 2 ' h* '

Note que Ad/d* e Ah/h* representam, respectivamente, os erros percentuais


nas medidas da distância d e altura h. Não é difícil de ver que os valo­
res máximo e mínimo de Al{x,y)fl{d*, h*) são obtidos tomando-se Ad/d* e
Ah/h* com sinais contrários:

-6.5% = 2. (-2% ) - i . (5%) < < 2 . (2%) - i . (-5% ) = 6.5%.

Desta maneira, podemos estimar 0 erro percentual máximo no cálculo da


circulação c em ±6.5%. -

A equação (7.2) pode ser reescrita como

f{a + hi,b + h^) — f{a, 6) = ^ (® ) b) • hi + ’ ^2 b, h\, /12).


dy
V{h,M) T(huh2)
248 Aproximação linear e a regra da cadeia

Ela nos diz que a variação V(hi, h 2) = f{a + hi^b + h 2) —/(a , b) do valor da
função / no ponto p = (a, 6) pode ser aproximada pela transformação linear

T:
( h u h 2) ^ = + ’

e que o erro R {a,b,hi,h 2) = V{hi , h 2) — T{h i,h 2) cometido nesta apro­


ximação tende a zero mais rapidamente do que /i-2)|| = ^/hl + h\. A
matriz associada a esta transformação linear é dada por

J 1x2

de modo que

■/ii ■
T(f>i. hl) = (a, í.). '>1+ i)-hi =
- 1x2 > 2 . J 2x1

T é a “melhor” transformação linear que aproxima a variação de / perto do


ponto (a, 6) ou, equivalentemente, I (que define a equação do plano tangente)
é a melhor função afim que aproxima / perto do ponto (a, ò).

Funções escalares de 3 variáveis

E para uma função de três variáveis? Se w = f{x, y^z) é uma função de


classe p = (a, 6, c) é um ponto interior do domínio de f e

l{x,y,z) = f{a,b,c)+

b, c ) . { x - a ) + (a, 6, c) • (y - 6) + ^ { a , 6, c) • ®,
dx
então
f {x, y, z ) - l { x , y , z ) ^
(x,y,z)-y(a,b,c) \\{x - a,y - b, Z - c)\\
f { x , y, z ) - l{x,y, z)
= 0.
(x,y,z)-¥(a,b,c) {x — + (y ~ í>)^ + {z — c)^
7.2 Aproximação linear em Cálculo II 249

I é a única função afim que satisfaz as equações. Ou, usando uma notação
vetorial mais compacta (x = (x^y^z) e p = (a, 6, c)), temos que se / é de
classe p é um ponto interior do domínio de f e

l{x) = /(p ) + |^ ( p ) • (x - a) + |í( p ) ■ {y - b ) + |^ ( p ) • {z - 6),

então
/(x ) —l ( x )
lim = 0.
x^P | | x - p | |
Em outras palavras, é possível aproximar uma função / de classe de
três variáveis na vizinhança de um ponto p = (a, 6, c) pela função afim
Kx) = /(p ) + {df/dx){p) ■{x - a) + {df/dy){p) ■{y-b) + {df/dz){p) - { z - c )
e o erro ií(p, x) = /(x ) —l { x ) cometido nesta aproximação tende a zero mais
rapidamente do que ||x —p||. Mais formalmente,

/(* ) = /(p ) + g ( p ) ■(x - o) + ^ ( p ) ■{y-b) + | í ( p ) . (z - c)

/(x )

+ R{p,x),

com

x-4p | | x - p | | x-yp | | x - p |
Podemos reescrever estas expressões em termos de h = (/ii, /i2, /13) = x —p
(h descreve a “pertubação” com relação ao ponto p), de modo que x = p + h
e

/(P + h) = /(p) + |^(p) • hl + ^ (p ) • /i2 + |^(p) ■hz + R{p, h),

com lim ^ = 0. (7.4)


h-.o l|h||
A equação (7.4) pode ser reescrita como

/( P + h) - /(p ) = |^ ( p ) • hl + |^ ( p ) • hz + |^ ( p ) • hz +R{p, h).


V(h) T(h)

Ela nos diz que a variação V (h) = / ( p + h) —/ ( p ) do valor da função / no


ponto p pode ser aproximada pela transformação linear T : —)■R definida
por
250 Aproximação linear e a regra da cadeia

r(h) = T{hu h2, /1 3 ) = |^(p) •h + ^(p) •h + (p) •/1 3 ,

e que o erro i?(p, h) = y ( h ) — T (h) cometido nesta aproximação tende a


zero mais rapidamente do que ||h|| = y/hl + h,2 + hl. A matriz associada a
esta transformação linear é dada por

d f, . d f. - 5 /, .
J 1x3

de modo que

T(h) = + +
hl
d f. . d f. . d f. ,
h2
dx^^^ dy^^^ dz^^^ J 1x3
h 3x1

h.
dy^^^ dz^^^ J 1x3
T é a “melhor” transformação linear que aproxima a variação de / perto
do ponto p ou, equivalentemente, I é a melhor função afim que aproxima /
perto do ponto p. Também, I é a única função afim que satisfaz as condições

lí \ fí \ í \ { \ \ í \ \ í \
i(p )= /(p ), ãí< p) = & ( p ) ’ ãi;<p) = ^ ( p > ' â i(p )= f c < p > -

Funções escalares de n variáveis

Evidentemente, tudo isto pode ser estendido para funções que dependam
de n variáveis. Se u; = /(x ) = / ( x i , .. .,Xn) é uma função de classe
p = (p i,. . . , p„) é um ponto interior do domínio de / e

^(x) = /( p ) + ^ ( p ) • (xi - pi) + • • • + ^ ( p ) • (x„ - p„),

então

«P ||x - p ||
7.2 Aproximação linear em Cálculo II 251

Em outras palavras, é possível aproximar uma função / de classe de n


variáveis na vizinhança de um ponto p pela função afim I e o erro i?(p, x) =
/(x ) —Z(x) cometido nesta aproximação tende a zero mais rapidamente do
que ||x —p||. Mais formalmente,

/(x ) = /( p ) + ^ ( p ) • (a;i - Pl) + • • • + ^ ( p ) • i^n - Pn) +R{p, x),


í(x )

com
ií(p ,x ) /(x ) —í(x)
lim .. = lim = 0.
x^p|lx-p|l x-tp | | x - p |
Podemos reescrever estas expressões em termos de h = (/ii,. . . , /i„) = x —p
(h descreve a “pertubação” com relação ao ponto p), de modo que x = p + h
e

/ ( p + h) — /(p ) + ^ ~ ( P ) • ------ 1" ^ ^ ( P ) ■ -RÍPih),

com lim ^ = 0. (7.5)


h-fO ||h||
A equação (7.5) pode ser reescrita como

/( P + h) - /(p ) = ^ ( P ) ■ h + --- + ^ ( P ) • K + R {p ,h).

K(h) 7(10'
Ela nos diz que a variação V{h) = f{ p + h) — /(p ) do valor da função / no
ponto p pode ser aproximada pela transformação linear T : R definida
por

T{h) = T { h , . . . , K ) = ^ { p ) - h + ... + ^ { p ) . K ,
UX\ UXj i

e que o erro i?(p, h) = y (h ) —T(h) cometido nesta aproximação tende a


zero mais rapidamente do que ||h|| = ^/hl + ■ + h'^. A matriz associada a
esta transformação linear é dada por

dx,n J Ixn
252 Aproximação linear e a regra da cadeia

de modo que

T(h) = |;(P) + -
d Xn
hl
^(P)'
a*»' '.- Ix n
. hji nxl

•h.
[ > -
^(p)'
Ixn

r é a “melhor” transformação linear que aproxima a variação de / perto


do ponto p ou, equivalentemente, I é a melhor função aíim que aproxima /
perto do ponto p. Também, I é a única função afim que satisfaz as condições

lí \ ff \ í \ í \ f \ f \

Vamos resumir os resultados que obtivemos até agora em um teorema.

Tfeorema 7;3 (APRòXlkAÇÃO LmeAR: 6 CASO êscalar ) Consi­


dere umã função f : D ~C W M.làé classé (7^ e p = (pii •••i Pn) am
!ponto no interior de D, Então existe umà única função afim I que
satisfaz as condições /(p) = /( p ) e J
dl , . d f , . dl , . ^ f r \

, í (x) = /(p) + ^ ( p ) ‘ (®i - P l ) * *rf ^ {p ) • (Xn - Pn)-

;Maiè-áinda, vale que' ' • '

■. ' / itoífciM .-p,' -i -


11^'t p í ]
7.2 Aproximação linear em Cálculo II 253

isto é, a diferença entre /( x ) e l{x) tende a zero mais rapidamente do


que j|x —pjj. Em outras palavras,

/( x ) = /( p ) + ^ ( p ) • { x i ~ p i ) + - " + ^ ( P ) • K -P n ) +

___ i , „ ií{P.x) „
com lim ------- i7 = U.
x -fp llx -p |{

Funções vetoriais: o Cciso geral

Também podemos aproximar uma função vetorial f de classe por uma


transformação afim 1 na vizinhança de um ponto p no interior do domínio
de f . O que vamos fazer é uma extensão imediata do teorema (7.3) para
funções escalares.
Considere uma função vetorial

f: D CW
X - (X i, . . . , X n ) y = f(x) = {y i, ...,ym) = (/l(x ), . . . ,/ m ( x ) )
definida em um subconjunto D de R". Como vimos, podemos pensar que
f: £) C R" ^ R"* é uma maneira de se agrupar ou representar m funções
escalares definidas em D:

/i: D C R” ->
X = ( z i , .. - , Xn)

/2 : D c R"
X - ( x i , ..• ) Xji) 1- ^

fm ■ D c R" R
X (2:1, . . . , X71) I—
> í/„, = yj„(x) —fm{xi, . . . , Xji)

Como f é de classe C^, então suas funções coordenadas /i, /2, • • •, /m também
são de classe C^. Logo, podemos aplicar 0 teorema (7.3) para elas e obter
254 Aproximação linear e a regra da cadeia

funções afins

^ l(x) = /l(p ) + | ^ ( p ) • ( a ;i- P i) +•■•+ ~ { p ) ■ {X n -P n ),

= / 2 (p) + | ^ ( p ) • ( x i - P i ) + -----h | ^ ( p ) • (o;„-p„)

^m(x) = /m (p ) + ^ ( p ) • (xi - P i ) + ------h ^ ( p ) - ( x „ - p „ )

que aproximam, respectivamente, /i, /2, . . . , fm-, nas proximidades do ponto


P = (p 1jP27 • • • jPti)- Mais especificamente.

/i(x ) = /i(p) + |^ ( p ) • ( x i - P i) H------ h ^ ( p ) • (a:„-p „)

+ -Ri(P,x),

/2(x) = /2(p) + | ^ ( p ) • (xi - pi) + • • • + ^ ( p ) - ( x „ - p „ )

+ -fí2(p,x),

/m ( x ) = /m ( p ) + | ^ ( p ) • (xi - Pi) + • • • + | ^ ( p ) • (a:„-p„)

+ J ? m ( p ,x ) ,

com i?i(p ,x ) = /i(x) - /i(x ), i?2(p,x) = Z2(x) - /l(x), i?„j(p,x)


^m(x) - /m(x), e

, i „ 5 l( P l 4 = 0, lim = 0.
X^p ||X - P | X-4P ||X - p | x-^p ||X - p |

Observe que podemos reescrever as m igualdades acima para /i, /2, • • ■, /m,
usando matrizes:
7.2 Aproximação linear em Cálculo II 255

’ /i(x ) ' ’ /l(P) ' dxS xi - p i


/2(x) /2(P) X2 - P 2
= + dXn

_ /m(x) _ _ /m (p )_ ^fm / X Pn
ax„(P)

i2i(p,x)
i?2(p,x)
+

■Rm(p,x)
0 objetivo agora é reescrever esta equação matricial com uma notação fun­
cional mais compacta, isto é, sem 0 uso de coordenadas. Para isto, sejam
l(x) = (/i(x),Z2(x),...,Zm(x)), R (p ,x ) = (i?i(p ,x ),i2 2 (p ,x ),...,i?,„(p ,x ))
e

dXn^^^

Df(p) = dXn

/ X ^fm / X
ax„(P)

de modo que
f(x) = f(p) + £»f(p) • (x - p) + R (p, x). (7.6)
l(x )

com

x ^ p |l x - p || x^p | | x - p | |

Em outras palavras, é possível aproximar uma função vetorial f de classe


na vizinhança de um ponto p pela transformação afim 1 e o erro R (p, x) =
256 Aproximação linear e a regra da cadeia

f(x) —l(x) cometido nesta aproximação tende a zero mais rapidamente do


que ||x —p||. A equação (7.6) pode ser reescrita como

f(P + h) - f(p), = .Pf(p) • h + R (p, h).


V(h) T(h)

Ela nos diz que a variação V(h) = f(p + h) —f(p) do valor da função ■/
no ponto p pode ser aproximada pela transformação linear T : M" -> M'"
definida por T(h) = -Df(p) • h, isto é,

^d (xpi )’ ■.. ^ (p )
hl
h2
^ (P )
T{ hi , . . . , hn)

/ X ^fm / X hn
nxl

e que o erro R (p, h) = V(h) —T(h) cometido nesta aproximação tende a


zero mais rapidamente do que o ||h|| = \/h i-\------ h /i^. A matriz associada
a esta transformação linear é dada por

dXn

i5f(p) = a»>

/ X
õx, 'P*

Ela é denominada a matriz jacobiana (ou, mais simplesmente, jacobiana) de


f no ponto p. A matriz jacobiana Df{p) representa em Cálculo II o mesmo
papel que a derivada f { p) representa em Cálculo I. Muitas idéias, teoremas
e algoritmos são elaborados com o seu uso. A transformação linear induzida
por 7)f(p) é denominada a derivada de f no ponto p.
Novamente, T é a ‘‘melhor” transformação linear que aproxima a variação
de f perto do ponto p ou, equivalentemente, 1 é a melhor transformação afim
que aproxima f perto do ponto p. Também, 1 é a única transformação afim
que satisfaz as condições
7.2 Aproximação linear em Cálculo II 257

l(p) = f(p) e ^ ( p ) = ^ ( p ) p a ra i = j

Vamos resumir os resultados que obtivemos até agora em um teorema.

T eo rem a 7 .4 ( A p r o x i m a ç ã o l i n e a r ; o c a s o v e t o r i a l ) Con­
sidere uma função vetorial f: D c R” - t de classe e p =
(pi, ■ ,Pn) vm ponto do mterior de D. Então existe uma única trans­
formação afim 1 que satisfaz as condições l(p ) = f(p) e

p a ra í = l , - . , m,
Õx
a saber,
l(x ) = f(p) + D f ( p ) . (x - p),
em que

dxfi (P)

D f(p) = W p’ ■■■ dXfi (P)


(P)
dXn mxn
é a matriz jacobiana de f em p. Mais ainda, vale que

isto é, a diferença entre f(x) e l(x) tende a zero mais rapidamente do


que ||x — p(|. Em outras palavras,

f(x) = f(p ) -b U f(p ) • (x - p) -b R (p , x),

com
l i n , ® Í E 4 = 0.
x^ p||x-p ||
258 Aproximação linear e a regra da cadeia

Exem plo 7.4 Considere a função vetorial f: definida por

(j/i,2/2) = f(® i,2:2,X3) = { + +

que foi apresentada no exemplo (6.3). As funções coordenadas de f são

y\ = fl {xi , X 2, X 3 ) + ^2 + X3 ^ t/2 = f 2 {xi, X2, X z) - ■X 2 ■X3.

Portanto, a matriz jacobiana de f no ponto (ii, X2, X3) é

[ d h . d h . dfi.
2:3) Xz) Xz)
Df{xi,X 2,X3)
àh. df2, df2.
2:3) Xz ) Xz )
2x3

-
1/3 1/3 1/3
'Xz X i • Xz Xi • X2
_ ‘i \ / x \ - x\- x\ Z ^ x \ - x \- x\ 3^ X i •X 2 ' Xz - 2x3

Uma vez que f(l, 2,4) = (7/3,2) e

1/3 1/3 1/3


D f(l,2,4) =
2/3 1/3 1/6 2x3

segue-se que a equação da transformação afim que melhor aproxima f nas


proximidades do ponto p = (1,2,4) é dada por l(x) = f(p) + Df{p) • (x —p),
isto é.

1/3 1/3 1/3 Xi — 1


7/3
l(xx, X2j 2J3) + • X2 — 2
2 2/3 1/3 1/6
_ X3 - 4 _

= ^xi/ 3-|-X2/3 + X3/3, 2xi/3-f-a;2/3-|-X3/6^ .

Podemos usar a transformação aiim 1 para estimar o valor de f(xi, X2, X3) em
pontos {xi,X2,xz) próximos de (1,2,4). Por exemplo.

1(1.1,1.9,3.9) = (2.3, 2.016...),


7.2 Aproximação linear em Cálculo II 259

enquanto que

f(l .1,1.9,3.9) = (2.3, 2.012...).

Observe que h{xi , X 2^xz) = fi{xi , X 2^xs) para todo {xi^X2,x^) E R+ . Isto
não é uma coincidência, como veremos mais adiante.

Vimos que a matriz jacobiana Dí{p) de uma função f em ponto p define a


transformação linear que melhor aproxima a variação da função perto deste
ponto. Mas o que aconteceria se a própria função já fosse uma transformação
linear? Lembre-se que uma transformação linear T nada mais é do que uma
função vetorial definida por uma matriz: T(x) = A • x. Ora, a melhor
transformação linear que aproxima a variação de uma transformação linear
e a própria transformação linear. Como conseqüência, a matriz jacobiana de
uma transformação linear é igual à matriz que define a própria transformação
linear, isto é, i)T (p ) = A. Mais formalmente.

T eorem a 7,5 Seja T : uma transformação linear definida


por uma matriz Amxm isto é, seja
T(x) = A- x.
Então
D T(p) = ^
para todo p 6

Demonstração: Para fixar as idéias, vamos fazer o caso n = 3 e m = 2, isto


/ *
e,

xi
a b c
T(xi,a;2,X3) = X2 = (axi + 6x2 + CX3, d x i + ex2 + /x3).
d e f
xs

Como as funções coordenadas de T são

Ti ( x i ,X2,X3) = a x i + 6x2 + cx3,


T 2 ( x i , X 2, X3) = d X i + eX2 + / X 3 ,
260 Aproximação linear e a regra da cadeia

não é difícil de ver que

^ ( P i.K .P s ) ã í j í f i .K .» )
-DT(p i ,P2,P3) =
9T2 z . dT<i
g^^[PhP2,Ps) g^{PhP2,PS) ^ (P l,P 2 ,P 3 )

a b c
d e f
= A.

O caso geral é demonstrado da mesma maneira. Se

aii ai2 • ■* Xi
021 022 • ^2n X2
T(a;i,X 2 , . . . , x „ ) =

O771I Oj7^2 ’* ^mn

então

X(xi, X2j • • • j ^n) — ( ^ ^ ^Ik * ^ ^ • • • j ^ ^ ^mk * |•


\A;=1 A;=l k=l /

Desta maneira, a í-ésima função coordenada de T é dada por


n
T ^ ( x i, X2, • • • 5 ~ ^ ^ ^ i k * ^A; ~ ^ il * ^1 d" ai2 * 3^2 “h • * • “h * X ji
A:=l

de modo que, para calcularmos o elemento na posição ij da matriz jacobiana


de T no ponto p, basta derivarmos Tj com relação a Xj no ponto p. Mas
note que
dTi, . d ,
(p j — [ an • X \ + Ü i 2 * a:2 + * • • + CUn * — ^ij)
dxj dxj x=p
isto é, o elemento na posição ij da matriz jacobiana D T(p) é igual ao ele­
mento na posição ij da matriz A. Como as matrizes D T(p) e A possuem os
mesmos elementos, concluímos que elas são iguais. b

O bservação: A matriz jacobiana de uma função escalar / : e uma


7.2 Aproximação linear em Cálculo II 261

matriz linha 1 x n:

8/ , 1 8/ 8/ , .
B /(x) =
L8 í ; W - Ixn

enquanto que a matriz jacobiana de uma curva parametrizada a ;


com a (í) = (o;i(í), a 2{ t ) , . . . , an{ t ) ) , é uma matriz coluna n x 1:

a[ {t )
aáíí)
Da{t) =

J nxl

A matriz jacobiana de uma função compartilha das mesmas propriedades


que a derivada de uma função de um variável que você aprendeu em Cálculo I.
O próximo teorema resume estas propriedades

Teorem a 7.6 (P ropriedades da matriz jacobiana ) Considere


C W^\e g: Dg C W duas funções vetoriais de
classe C'*', k > Q , Então : .. - ^ .

(1) f + g é de classe em í)f D Dg e D (f + g)(p) = D f(p) -f D g(p)


para todo p e DfO Dg.

(2) Se c € M é uma constante real então c • f é de classe em Df e


D (c • :Q(p) = c • D f(p) para todo p € Df.
Se m = 1, isto é, se / e 5 são funções escalares, então as propriedades
abaixo também valem.

(3) f - g é d e classe em D /.n Dg e D (/ • g ) ( p ) = p(p) • D /(p ) +


/(p ) • D g ( p ) para todo p e D / n Dj.
(4) f j g é de classe em D f C\Dg - { q e Dg \ g ( q ) = 0} e

D Í t ) (nS = g ( P ) - D / ( p ) - / ( P ) - ^ g ( P ) V;
: - {g(p)F
para todo p € £ > / n D j - {q € D j t g(q) = Q}.
262 Aproximação linear e a regra da cadeia

Demonstração: Basta observar que as entradas da matriz jacobiana são for­


madas por derivadas parciais que, por sua vez, são obtidas através da de­
rivação de uma função de uma variável. Como a operação de derivação em
Cálculo I satisfaz todas as propriedades enunciadas acima, estas proprieda­
des estendem-se naturalmente para a matriz jacobiana de funções vetoriais.
Vamos ilustrar esta idéia com a demonstração da primeira propriedade.
Da definição de matriz jacobiana, temos que

^ (f+ g )(p ) =

d{fm "b 9m) / \ d{fm + 9m) / N


dxi ^ ^ Oxfi

Por outro lado, vale que {d{fi + gi)/dxj){p) = {dfi/dxj){p) + {dgi/dxj){p)


(estamos usando a propriedade de que a derivada parcial da soma é a soma
das derivadas parciais de cada parcela) e, portanto.

ír.-\ ír^) 4. ír^)

X , ^92
D(f+g)(p) = ãíI<P> dx„ dXn

dfm ^9m ( \ ^Jm / \ , ^9m / \


dx\ (P) +

dg\ / X

dXn dXn

^ ^ 2 / X ^ ^ 2 z X

dXn + ■■ dXn

/ \ 5 / m z X ^9m ! \ ^9m ( \

= Df(p) + £)g(p)
7.3 Composição de funções 263

onde, na penúltima igualdade, usamos a definição de soma de duas matrizes.


A demonstração das demais propriedades se faz de maneira análoga e a
deixaremos como um exercício para você. h

E xem plo 7.5 Considere /(a;, y, z) = + y'^ + g[x^ ?/, z) = + 1e

U x y z) = = x-^ + y^ + z \
g{x,y,z) x'^ + 1

Aplicando-se diretamente a definição de matriz jacobiana para /i, vemos que

dh, \ dh, X dh. ,


Dh{x, y, z) =

2 x ( l — —z^) 2y 2z
(a;^ + 1)^ + 1 + 1

Por outro lado, aplicando-se a “regra do quociente” , concluímos que


y(x, y, z) • Df{x, y, z) - /(x , y, z) ■Dg{x, y, z)
Dh{x, y, z) =
[g{x,y,z)f
(x^ + 1) • [ 2 X 2 y 2z] — + y ‘^ + z ‘^) • [ 2 x 0 0 ]

2 x ( l ~ y ^ — z^) 2y 2z
(x^ + 1)^ x^ + 1 x^ + 1 _
Note que as duas maneiras conduzem ao mesmo resultado.

O bservação: Lembramos que a “regra do quociente” só vale para funções


escalares (funções cujo contradomínio é um subconjunto de R) uma vez que
a divisão de funções vetoriais não está definida.

7.3 C om posição de funções

A partir de duas funções podemos criar novas funções através da soma,


diferença, multiplicação ou divisão das funções iniciais. Um outra operação
muito importante é a composição de funções.
264 Aproximação linear e a regra da cadeia

D efinição 7,1 ( C o m p o s i ç ã o d e f u n ç õ e s ) Considere f . A C e


g: C Z> com f ( A ) C C. A função h. A D obtida aplicando-se
primeiro f a x € A e então aphcando-se g ao resultado f(x) é denomi­
nada a função composta das funções g e f e denotada por g o f;

A figura (7 3) ilustra a composição de g com f.

Figura 7.3: A composição de g com f.

Exem plo 7.6 A função h{x) = sen^(x) é resultado da composição de g{x) =


com f{x) = sen(a:). A função h{x) = {x + 4)^ é resultado da composição
de g{x) = x^ com / ( íc) = x + A. A função h{x^ y) = ^Jx'^ + é resultado da
composição de g{x) = ^Jx com /(x , y) = + y^. ■

E xem plo 7.7 Composições de funções aparecem naturalmente em modelos


dinâmicos^ isto é, modelos para os quais as variáveis dependem do tempo.
Por exemplo, suponha que a função de produção Cobb-Douglas z = f { x , y ) =
4• represente a produção de uma empresa em função de seu capital
X e de seu trabalho y. Suponha também que a curva parametrizada oc{t) =
(x(í),y(^)) = (10000 + 100 • í, 625 + 5 • í) descreva como o capital x{t) =
10000 + 100 -t e o trabalho y{t) = 625 + 5 •t desta empresa variam no tempo.
Então, se quisermos estudar como a produção desta empresa varia no tempo,
somos naturalmente levados a considerar a função composta

h{t) = ( / o a )(í) = 4 • (10000 + 100 • ■(625 -h 5 •


7.3 Composição de funções 265

É muito importante que você adquira a habilidade de “enxergar” quem


está sendo composto com quem, identificando o domínio e o contradomínio
de cada função em uma composição, principalmente no caso em que uma ou
todas as funções não são dadas explicitamente.

Mais adiante veremos como expressar a matriz jacobiana de uma com­


posição em termos das matrizes jacobianas das funções que fazem parte da
composição. Isto resultará na regra da cadeia^ um teorema que será utili­
zado com bastante freqüência na teoria que vamos desenvolver. Mais ainda,
você certamente usará a regra da cadeia em qualquer disciplina em que uma
derivada apareça: Microeconomia, Cálculo III, Cálculo IV, Física, Equações
Diferenciais, etc.
O segredo na utilização da regra da cadeia está na identificação correta
das funções que fazem parte da composição! Vamos ver alguns exemplos.

Exem plo 7.8 A função 2: = f{x{t)^y{t)) é uma função de R para R que


pode ser descrita como a composição da função escalar z = /(x ,y ) de R^
para R com a curva parametrizada cx{t) = {x{t)^y{t)) de R para R^. Mais
formalmente, se z = h{t) = f{x{t)^y{t)), então h = f o a.. b

E xem plo 7.9 A função 2: = f{x{u,v),y{u,v)) é uma função de R^ para R


que pode ser descrita como a composição da função escalar 2 = f {x, y) de
R^ para R com a função vetorial g{u,v) = {x{u,v)^y{u,v)) de R^ para R^.
Mais formalmente, se 2: = h{u, v) = /(x(n, v)^y{u^ v))j então h = f o g. ^

E xem plo 7.10 A função 2: = f{u + v, u — v + t) é uma função de R^ para


R que pode ser descrita como a composição da função escalar z = f{x^y) de
R^ para R com a função vetorial g(u, v^t) = {u + v, u —v + t) de R^ para R^.
Mais formalmente, se 2: = h{u, v^t) = f ( u + v>,u — v + t) então h = f o g.
Observe que g é uma transformação linear de R^ para R^ (por que?). g

E x e m p lo 7.11 Sejam p um ponto e v um vetor de R^. A função 2: =


/( p + í - v ) é uma função de R para R que pode ser descrita como a composição
da função escalar z = f{x) de R” para R com a curva parametrizada a{t) =
p + í • V de R para R^ ( a representa a reta que passa pelo p na direção do
vetor v). Mais formalmente, se 2; = h{t) = / ( p + í • v), então h = f o a. ^
266 Aproximação linear e a regra da cadeia

7.4 Lembrando Cálculo I: a regra da cadeia

Considere f : Df C ^ M. e g: Dg C K. duas funções de classe C*,


com > 1, tais que f {Df ) C Dg. Podemos então construir a composição
h “ g o f \ D}i — D^ (Z M — M.
A regra da cadeia afirma que h também é uma função de classe C'^ e que
sua derivada h' = {g o f )' pode ser obtida em termos das derivadas f e g'
de / e Mais precisamente,
h'{p) = {gof y{p) = g \ f { p ) ) . f { p ) . (7.7)

Exem plo 7.12 A função h{x) = sen(x^ + 4x) pode ser escrita como a
composição de duas funções: h{x) = {g o f){x), com f{x) = x^ + 4 x e
g{z) = sen(z). Como f e g são funções de classe C°° segue-se que h também
é uma função de classe C°°. Vamos usar a regra da cadeia para calcular
a derivada de h. Para isto, precisamos calcular as derivadas de / e p. A
derivada de ^ é
g'{z) = cos(z)
e a derivada de f é
f'{x) = 3x^ + 4.
Desta maneira, pela regra da cadeia, a derivada de h é
h \ x ) = g'{f{x)) ■f'{x) = cos(/(x)) • f'{x) = cos(a;^-H 4 x) • (3x^ -|-4 ). ^

7.5 A regra da cadeia em Cálculo II


Como veremos, a regra da cadeia em Cálculo II é muito parecida com a
regra da cadeia de Cálculo I se utilizarmos a notação matricial.

T eorem a 7.7 (A REGKA d a c a d e i a ) Considere f; Df c R” ->


e g Dg C —>■R*' duas funções de classe C7^ tais que f(Df) c Dg
de modo que podemos construir a composição h = g o f : D ^ - ^ Dt C
R" - t R*. Então h também é uma função de classe (7* e a matriz
jacobiána de h em p é igual ao produto da matriz jacobiana de g
em f(p) pela matriz jacobiana de f em p-

Dh(p) = D(gô f)(p) = Dg(f(p)) . Df(p). (7 8)


7.5 A regra da cadeia em Cálculo II 267

Ou, mais explicitamente, se


x = (xi, y = {yh- ,ym)
|jjjjp |jp |||||Íjg ^ ^ ^

\ f(x) = (/i(x), .,/m (x)), g(y) = (3i(y),- ,9i{y)),


então a ^ a triz jacobiana de"!!^) = { hi { x ) , . . . , hi{x^) é dada por

di § dh
(P) (P)
ÔXn

dhi dh
. dxv
(P) (P)
dXn
Ph(p)
Bh, , 1
■■
/ \

••• ■ãí:<p)J
Dç(f(p)) Dí{v )

Observe que -Dh(p) é uma matriz I x n, I?g(f(p)) é uma matriz I x m


e -Df(p) é uma matriz m x n , de modo que a multiplicação de matrizes
na expressão (7.8) pode ser efetuada.

Note a semelhança entre as expressões (7.7) e (7.8): as derivadas h'{p),


9'{f(,p)) ® f'{p) (^rie em Cálculo I são números reais) são substituídas, res­
pectivamente, pelas matrizes jacobianas D h(p), Dg(f(p)) e Hf(p). Eviden­
temente, 0 símbolo • na expressão (7.8) indica a multiplicação de matrizes,
enquanto que na expressão (7.7) ele indica a multiplicação de números reais.
Uma demonstração formal da regra da cadeia pode ser encontrada nas
referências [01, 71] , contudo, vamos tentar fornecer uma justificativa mais
informal com base na idéia de aproximação linear desenvolvida no início do
capítulo. Pelo teorema (7.4), as variações de f em p e de g em f(p) podem ser
aproximadas pelas transformações lineares T e S definidas, respectivamente,
pelas matrizes jacobianas Df{p) e Dg(f(p)). A composição S o T destas
268 Aproximação linear e a regra da cadeia

transformações lineares deve fornecer uma “boa” aproximação da variação


da composição h = g o f no ponto p. Mas, pelo exercício [22], a composição
de duas transformações lineares é também uma transformação linear e a ma­
triz associada à função composta nada mais é do que o produto das matrizes
que define cada transformação linear na composição. Desta maneira, é na­
tural esperarmos que a matriz jacobiana D h(p) seja dada pelo produto das
matrizes jacobianas Dg(f(p)) e Df(p).

Vamos fazer uma revisão desta justificativa informal usando a notação


matricial: já sabemos, pelo teorema (7.4), que

g(y)« g(q) + ^g(q) •(y - q),


Agora, fazendo q = f(p) e y = f(x), obtemos

g(f(x)) « g(f(p)) + £>g(f(p)) • (f(x) - f(p)). (7.9)

Por outro lado, novamente pelo teorema (7.4), temos que

f(x) Ri f(p) + í>f(p) • (x - p).

Substituindo esta expressão no lado direito de (7.9), vemos que

g(f(x)) Ri g(f(p)) + Dg(f(p)) • (f(p) + I>f(p) • (x - p) - f(p)) ,


isto é,
g(f(x)) Ri g(f(p)) + í>g(f(p)) • i?f(p) • (x - p). (7.10)
Aplicando o teorema (7.4) mais uma vez, agora para h = g o f, segue-se que

h(x) Ri h(p) + £>h(p) • (x - p),


isto é,
g(f(x)) Ri g(f(p)) + D h(p) • (x - p). (7.11)
Comparando-se as expressões (7.10) e (7.11), não é difícil de se suspeitar que

-D(g o f)(p) = Dg(f(p)) • i:>f(p).

Exercício resolvido 7.1 Considere as funções vetoriais

f: ^2
(x,y) !->■ f{x,y) = - y'^,x ■y)
7.5 A regra da cadeia em Cálculo II 269

{u^v) 1-^ g[ujv) = [sen[u ' v)jU + VjU — v)


Encontre a matriz jacobiana da função composta h = g o f: no
ponto p = (1,1).

S o l u ç ã o : Pela regra da cadeia, para encontrarmos D h (l, 1 ), basta calcu­


larmos í? g (f(l,l)), í)f(l, 1) e, em seguida, efetuarmos a multiplicação de
matrizes D g(f(l, 1)) • Df{l, 1). As funções coordenadas de f são

fi{x, y) = x^-y^ e f2{x, y) = x-y,

de modo que

dfi, ^ 9 fi
2-X -2-y
Df{x,y) ^
df2, \ ^ h ( N y X
j ^ ( x , y ) ~^(x,y)

As funções coordenadas de g são

= sen(ti • í;), g2{u,v) = u -\-v e g2,{u,v) = u — v,

de modo que

V ■cos{u ■v) u •cos(u ■v)


dg2, . dg2, .
D^{u,v) - 1 1

dgz, ^ dgz 1 -1

No ponto (a;, y) = p = (1,1) temos

2 -2
Df ( l , l ) =
1 1

e, no ponto (u, v) = f(p) == f(l, 1) = (1^ —1^, 1 • 1) = (0,1), temos


270 Aproximação linear e a regra da cadeia

1 0
1 1
1 -1

Logo, m ( l , 1) = D(g o f)(l, 1) = D g(f(l, 1)) • DÍ{ 1 , 1) = L>g(0,1) • D f(l, 1),


isto é,

■1 0 ■ '2 - 2 ‘
' 2 -2 '
Dh { l , l ) = 1 1 = 3 -1
11 11
_ 1 -1 _ _1 -3 _
Dg(f(l,l)) £)f(l,l)

Em particular, se h\, e são as funções coordenadas de h, então

dhi
(1,1) = - 2 ,
dy

Ô/l2 dho
(1,1) = 3, ^ (1 ,1 ) = - l ,
dx dy

(1,1) = - 3 .
dy

Evidentemente, você poderia calcular a matriz jacobiana ílh ( l, 1) sem a


regra da cadeia. Basta efetuar primeiro a composição:

h(a^,y) = (gof)(a:, 2/) = g(f(a:,y)) = - y"^, x ■y)


= (sen ((a;^ - y^) ■x ■y) ,x"^ - y'^ + x ■y,x'^ - y'^ - x ■y) ,

depois calcular a matriz jacobiana Dh{x^ y) diretamente:

dhi. . dhi, ,

dh 2 , . dh.2 , .
Dh{x,y) =
ô/i3, , dhz ■
7.5 A regra da cadeia em Cálculo II 271

(3 y — 2/^) COS( —2/^) xy) —3 x 2/^ ) cos ( ( x ^ —2/^) íC2/)


2 x + 2/ - 2y + x
2 x —y —2y —X

e, íinalmente, substituir os valores x = 1 e y = 1 :

2 -2
Dh { l , l ) = 3 ~1
1 -3

Você poderia se perguntar: por que calcular a derivada (matriz jacobiana) de


uma função composta pela regra da cadeia se é possível efetuar a composição
e derivar o resultado diretamente? Neste exercício resolvido, de fato, não
vemos a vantagem de um método com relação ao outro. Por outro lado,
nem sempre temos explicitamente as funções que fazem parte da composição
(veja os exemplos (7.8), (7.9), (7.10) e (7.11)). Por isto, a regra da cadeia
é uma ferramenta extremamente útil quando estamos querendo estabelecer
resultados teóricos. -

Exercício resolvido 7.2 Sejam f: e g: as funções veto­


riais definidas no exercício resolvido anterior. Encontre a matriz jacobiana
da função composta h = g o f : R^ —)►R^ em um ponto p = (x, y) qualquer.

Pela regra da cadeia, para encontrarmos Dh(x,2/), basta calcu­


S o lu ção :
larmos D g(f(x,2/)), í?f(x,2/) e, em seguida, efetuarmos a multiplicação de
matrizes Dg(f(x,2/)) • í)f(x,2/). Como vimos no exercício resolvido anterior.

dfi, s d fi
2 -X - 2 - y
Df{x,y) =
df2, . 0/ 2 , . y X

dg\( . dgi
{u,v)
dv
V • cos(u -v) u- cos(u • v)
^g2 / \ ^g2 / \
Dg{u, v) = ^(u.v) 1 1
1 -1
dgz, ^53 /
272 Aproximação linear e a regra da cadeia

No ponto {u, v) = f(p) = f(a;, y) = (a:^ - y ^ , x - y) temos

xy COS — y“
^ )x ■y) {x^ — y"^) cos ((x^ —y^) xy)
Í)g(f(x,í/)) = 1 1
1 -1

Portanto, efetuando-se a multiplicação de matrizes Z>g(f(x, y)) • Df(x,y),


obtemos que Dh.{x, y) é igual a

(3 x^ y —y^) cos ((x^ —y^) xy) (x^ —3 x y^) cos ((x^ —y^) xy)
2 x -fy - 2 y - |- x
2x —y —2y —X

o que coincide com o resultado obtido no exercício resolvido anterior.

Exercício resolvido 7.3 Use a regra da cadeia para calcular a derivada da


função z = h(t) = f{x{t), y(í)) do exemplo (7.8). Assuma que f , x e y sejam
funções de classe C^.

S o l u ç ã o : A função z = h{t) = f{x{t), y{t)) é uma função de R para R que


pode ser descrita como a composição da função escalar z = /(x , y) de R^ para
R com a curva parametrizada a (í) = (x(í),y(í)) de R para R^. Pela regra
da cadeia, h também é uma função de classe e Dh{t) = Df{a.{t)) •Da{t).
Como

x'{t)
Da{t) = e Df { x, y) =
y'(t) 2x1 J 1x2

segue-se que
x'(í)
Dh{t) = Df{oc{t)) • Doc{t) =
1x2 . . 2x1

g ( a ( í ) ) . í ' ( ‘) + f j ( a W ) •!/'(()
1x1

isto é.

Dh{t) = g ( x ( i ) , ,{t)) . x'(i) + |í ( x ( í ) . !,(()). v'{t)


1x1
7.5 A regra da cadeia em Cálculo II 273

Em particular, como
dh
Dh{t) =
dt {t) J 1x1
segue-se que

*'(Í) = f (i) = ■A t ) + ^ { x ( t ) M t ) ) - y ' ( t ) .

Exercício resolvido 7.4 Use a regra da cadeira para calcular as derivadas


parciais de primeira ordem da função 2: = h{u,v) = f{x{u^v),y{u^v)) do
exemplo (7.9). Assuma que f ^ x e y sejam funções de classe C^.

S o l u ç ã o *. A função 2: = h{u^v) = f{x{u^v),y{u,v)) é uma função de


para R que pode ser descrita como a composição da função escalar 2: =
f{x^y) de R^ para R com a função vetorial = {x{u^v)^y{u^v)) de
R^ para R^. Pela regra da cadeia, h também é uma função de classe e
Dh{u,v) = Df{g{u,v)) • Dg{u,v). Como

~ dx . s dx , .
D^{u,v) =
dy, . dy
-J 2x2

com X = x(n, v) e y = y[u^ v) as funções coordenadas de g, e

df, X df. ,
Df { x, y) =
1x2

segue-se que
Dh{u,v) = Df{g{u,v)) ■Dg{u,v)
r dx
du
1x2 dy, X dy
L du 2x2

Efetuando-se a multiplicação de matrizes na expressão acima e lembrando


que, por definição.

dh ^ dh, X
Dh{u, v) —
J 1x2
274 Aproximação linear e a regra da cadeia

concluímos que
dh d f . , .. dx. , 9 /, , ,, dy. .

dh

Exercício resolvido 7.5 Use a regra da cadeia para calcular as derivadas


parciais de primeira ordem da função z = h[u^ v, t) = f { u + v^u — v + t) do
exemplo (7.10). Assuma que / seja uma função de classe C^.

S o l u ç ã o : A função z = h{u, v, t) = f { u + v, u — v + t) pode ser descrita


como a composição da função escalar z = f[x^y) deR^ para R com a função
vetorial g(n, u, í) = {u + v^u —v + t) de R^ para R^. Pela regra da cadeia, h
também é uma função de classe e Dh{u,v,t) — Df{g{u,v^t))'Dg{u,v^t).
Como as funções coordenadas de g são dadas por

gi{u, v^t) = u + V g 2 { u , v , t ) = u - v + t,

segue-se que
dgi. .. dgi dgi
ã i - í ” ’”-')
Dg{u,v,t) =
dg2, dg2, .. dg2, ..
L â T * " '” ’*)
1 1 0
1 -1 1
Uma vez que

df, . df. .
Df {x, y) =

temos
Dh{u, V, t) = Df{g{u, V, t)) ■Dg{u, V, t)
■1 1 0"
^{g{u,v,t)) ^{g{u,v,t))
1 -1 1
df, , df, ■1 1 0■
— (u + V , U - V + t) — (u + v , u - v + t)
dx dy 1 -1 1
7.5 A regra da cadeia em Cálculo II 275

Efetuando-se a multiplicação de matrizes na expressão anterior e lembrando


que, por definição,

dh. ^ dh. \ dh, .


Dh{u^v^t) = ^ ( ....,1 )

concluímos que
dh. df.
— (u.+ u, u - u + í) = — { u + v , u - v + t) + — ( u + v , u - v + t),
ou ox ay
dh, \ df, \ df, ,
— {u + v,u - V + t) — — {u + v , u - v + t ) - — {u + v , u - v + t),
ov ox oy
dh, df, .
— [u + v, u —v + t) = — {u + v , u - v + t).
ot oy

Exercício resolvido 7.6 Use a regra da cadeia para calcular a derivada da


função z = h{t) = / ( p + í • v) do exemplo (7.11) em í = 0. Assuma que /
seja uma função de classe C^.

S olução : A função z = h{t) = / ( p + í • v) pode ser descrita como a


composição da função escalar z = /(x ) = / ( x i , . . . , x„) de R" para R com a
curva parametrizada de R para R"

a ( í ) = p + í • V = ( p i , . . . ,p „ ) + 1 • ( u i , . . . , u„) = (pi + í • u i , . . . , p „ + í • V n ) .

Pela regra da cadeia, h também é uma função de classe e Dh{ 0) =


D f { a { 0)) -Da{ 0). Cojno as funções coordenadas de a são dadas por o;i(í) =
P1 + í • V i , a 2 Í t ) = p 2 + t - V 2 , a n { t ) = P n + t - V n , segue-se que

■ «l(í) ■ ■ Vl ”
Da{t) =
- < (í). nxl _ Vn . nxl

Uma vez que

Df { x i , . . . , Xn) = dx^Xh- - - , Xn)^ ••• Ê L ( ^


Ixn
276 Aproximação linear e a regra da cadeia

e a(0) = p + 0 • V = p, temos
Dh{Çi) = Df{oc{0)) ■Doc{0) = Df {p) ■Da{0)

-1 ■ vi ■
df , s df
■■■ - Ixn
. . nxl

^ // ^ df , .
J 1x1
Lembrando que, por definição,

Dh{Q) =
> 1x1

concluímos que
dh d!
i= l

O bservação: a maioria dos livros de Cálculo II não enuncia a regra da


cadeia com o uso da notação matricial. O que eles fazem é trocar a versão
matricial da regra da cadeia
\dhi dhi
-(P)
dXn

dhk, s dhk, .

Dh{p)

■■■ dXn

^f m / \ ^f m / N
. |r ( f ( p ) ) - ax„(P>J
DgiKp))
(estabelecida para a função composta h = g o f) por expressões em termos
das entradas das matrizes envolvidas. Mais especificamente, a expressão ma­
tricial acima diz, por exemplo, que o elemento da primeira linha e primeira
7.5 A regra da cadeia em Cálculo II 277

coluna da matriz jacobiana Dh{p) pode ser obtido multiplicando-se a pri­


meira linha da matriz jacobiana Z?g(f(p)) pela primeira coluna da matriz
jacobiana I?f(p):
dhi dgi dfi
^ ( p ) = ^ ( f ( p ) ) . ^ ( p ) + ... + l ^ ( f ( p ) ) - | ^ ( p ) (7.12)
dyn
Tfl o Qi*
=Et«p))-Í(p)-
Podemos obter k • n expressões deste tipo considerando-se os k - n elementos
da matriz jacobiana D h(p), isto é, para cada í = 1 ,..., e j = 1 ,..., n, o
elemento da í-ésima linha e j-ésima coluna da matriz jacobiana Dh[p) pode
ser obtido pela multiplicação da í-ésima linha da matriz jacobiana Dg{í{p))
pela j-ésima coluna da matriz jacobiana Df(p)):

(7.13)
dx ( p ) = ^ ( f ( p ) ) • i f ^ ( p ) +■ ■• + i ^ ( f ( p » ■^dxj( p )
dyi dyn
dçi dfk
OXj
è í® » '
Assim, em resumo, o que a maioria dos livros de Cálculo II faz é trocar
uma única equação matricial (isto é, D h(p) = £^g(f(p)) • Dí{p)) pelas k • n
equações reais definidas em (7.13).

C U ID A D O ! C U ID A D O ! C U ID A D O !

É preciso tomar muito cuidado com o seguinte abuso de notação que


pode ocorrer com a regra da cadeia. Considere funções z = f{^^y) e
g(u, v) = v)jg 2{u, v)) de classe C^. Pela regra da cadeia, a função
composta
z = h{u, v) = { f o g){u, v) = /(g (u , v)).
é de classe e
dh. . d f , . .. dgi, . df, . dg2 , . ^
^ (« ,» ) = ^ (g(«,«)) ■ + ^ (g(«.«)) ■- ^ ( u . v ) , (7.14)
278 Aproximação linear e a regra da cadeia

Um abuso de notação cometido por vários autores é o de se omitir os


pontos onde as derivadas parciais são calculadas, com a justificativa de
economia de espaço nas fórmulas. Desta maneira, as expressões (7.14) e
(7.15), com este abuso de notação, escrevem-se da seguinte forma:
dh dg\ df dg2
(7.16)'
du dx du dy du’
dg2
(7.17)
dv dx dv dy dv'
Outro abuso de notação é o se trocar o nome da função pela variável
que representa o valor da função em um ponto do domínio. Em nosso
exemplo, isto corresponde a trocar / por z, h por w, gi por x e 52 por y:
dz dz dx dz dy
(7.18)
du dx du dy du
dz dz dx dz dy
(7.19)
dv dx dv dy dv
Contudo, esta notação, apesar de compacta, pode trazer confusão em
certos casos. Por exemplo, considere a situação onde z = f { x, y) e
g(x, y) = {gi{x,y), g2{x,y)). Se escrevermos a regra da cadeia para
a função composta z = h{x,y) = ( / o g){x,y) = f{g{x,y)) =
f{gi{x, y),g 2{x, y)) com estes abusos de notação, vamos obter as seguin­
tes expressões:
dz dz dx dz dy
(7.20)
dx dx dx dy dx'
dz _ dz dx dz dy
(7.21)
dy dx dy dy dy
Por outro lado, nestas expressões, d x / dx não significa a derivada parcial
de X com relação a x que, no caso, seria igual a 1! Aqui, d x / d x representa
a derivada parcial da primeira função coordenada de g com relação a x,
isto é, d x / d x = dg\/dx. Também, 0 símbolo dz / dx que aparece nos
dois lados da equação (7.20) representa duas coisas diferentes. No lado
direito, dz / dx representa a derivada parcial da função / com relação a x,
enquanto que, no lado esquerdo, dz / dx representa a derivada parcial da
função composta h com relação a x!
7.6 Exercícios 279

Moral da história: na dúvida, sempre utilize o nome das funções e nunca |


omita os pontos onde as funções estão calculadas.

7.6 Exercícios

[01] Encontre a equação do plano tangente ao gráfico da função definida por


f{x, y) = +2 + xy"^ + 10 y em x = 10 e y = 1 .
[02] Use a aproximação linear da função /(x , y) = + 2 x^j/^ + xy^ + lOy
no ponto (10,1) para obter uma aproximação de /(10.36,1.04).
[03] Use a aproximação linear da função de produção /(x ,y ) = no
ponto (1000,100) para obter uma aproximação de /(9 9 8 ,101.5).
[04] Use a aproximação linear da função /(x , y, z) = \/xU2 -f yi/3 + no
ponto (4,8,1) para obter uma aproximação de /(4 .2 ,7.95,1.02).
[05] Use a aproximação linear da função de produção Q = no
ponto (1000,125) para obter uma aproximação de Q(998,128).
[06] Por que podemos dizer que os gráficos das funções /(x ,y ) = x^ + e
^(x, y) = —x^ —2/^ + xy^ são “tangentes” em (0,0)?
[07] Calcule a matriz jacobiana das funções dadas abaixo.
(a) f:M 2 _^R 2^f(x,2/) = (x ,2/).
(b) f: R^, f(x, y) = (xe^ + cos(j/), x, x + e^).
(c) f: R^ ^ R ^ , f{x,y,z) = {x + e'' + y.yx^^).
(d) f: R^ —> R^, f(x,y) = [xyé^^^x sen(?/), 5 xj/^).
[08] Calcule a matriz jacobiana das funções dadas abaixo.
(a) f(x, y) = (e^, sen(xy)), (b) f(x, y,z) = { x - y , y + z),
(c) f(x, 2/) = (x + y , 2/ - X, xy), (d) f(x, y, z ) = (x + z, y - 5 z, x - y).
[09] Suponha que um pato esteja nadando segundo a reta definida parame-
tricamente por x = 3 + 8 í e y = 3 —2í. A temperatura da água é dada
por T = x^ cos(y) —y^ sen(x). Encontre a variação da temperatura em
função do tempo, dT/dt, de duas maneiras: (a) pela regra da cadeia e
(b) expressando T em termos de í e então derivando. Indique explici­
tamente as funções que fazem parte da composição, não esquecendo de
280 Aproximação linear e a regra da cadeia

estabelecer as dimensões do domínio e do contradomínio de cada função


envolvida.
[10] Verifique a regra da cadeia para as funções dadas abaixo. Indique expli­
citamente as funções que fazem parte da composição, não esquecendo de
estabelecer as dimensões do domínio e do contradomínio de cada função
envolvida.

(a) /(x , y) = + j/^) In com x = e* e y = e~K


(b) /(x , y) = X com x = t e y = —t.
(c) /(x , y^ z) = X + y‘^ + com x = cos(í), y = sen(í) e z = t.
(d) /(x , 2/, z) = {y‘^ — x^), com x = y=é ez=

[11] Verifique a regra da cadeia para u = x j y + y j z + zjx^ onde x =


y = é e z = , Indique explicitamente as funções que fazem parte da
composição, não esquecendo de estabelecer as dimensões do domínio e
do contradomínio de cada função envolvida.
[12] Verifique a regra da cadeia para u = sen(x2/), com x = t'^ + t e y = t^.
Indique explicitamente as funções que fazem parte da composição, não
esquecendo de estabelecer as dimensões do domínio e do contradomínio
de cada função envolvida.
[13] Seja 2; = y x M - ^ + 2xy^, onde x e y são funções de u. Encontre
uma expressão para dz/du usando a regra da cadeia. Indique explici­
tamente as funções que fazem parte da composição, não esquecendo de
estabelecer as dimensões do domínio e do contradomínio de cada função
envolvida.
[14] (a) Use a regra da cadeia para encontrar {d/dx)[x^) utilizando, para
isto, a função f{y^z) — y^.
(b) Calcule {d/dx){x^) utilizando 0 cálculo em uma variável,
(c) Qual maneira você prefere?
[15] O que está errado com o seguinte argumento: suponha que w = f[x^y)
com 2/ = x^. Pela regra da cadeia,
dw dw dx dw dy dw dw
dx dx dx~^ dy dx dx ^ dy
Assim, 0 = 2 *X • {dw/dy), de modo que dw/dy — 0.
7.6 Exercícios 281

[16] Considere a função de produção Cobb-Douglas Q = A Su­


ponha que as variáveis K e L variem com o tempo t e com a taxa de
interesse r segundo as expressões
10
K{t, r) = L{t, r) = 6 r + 250r.

Use a regra da cadeia para calcular a taxa de variação de Q com relação


a t quando í = 10 e r = 0.1.
[17] Considere a função de produção Cobb-Douglas Q = 4 Supo­
nha que as variáveis de capital e trabalho, K e L, variem com o tempo t
e com a taxa de interesse r, isto é, K = K{t,r) e L — L(t, r). Sabendo
que ír(10,0.1) = 10000, L(10,0.1) = 625,
D íí :(10, 0.1) = [ 2000 -100000 ] e DL(10,0.1) = [ 120 250 ] ,
calcule a taxa de variação de Q com relação a t quando í = 10 e r = 0.1.
[18] Sejam G : (0, -foo) x (0, -|-oo) C (0, -|-oo) X (0, -|-oo) C definida
por
10
G{x,y) = -,6x^ -t- 250?/

e F ; (0, -boo) x (0, -|-oo) C —>■R definida por F(r, s) = Se


H = F o G, calcule DH{ 10 , 0.1).
[19] Sejam G(x,?/) = (x^ + 1,?/^) e F(u, u) = {u + v,v'^). Calcule a matriz
jacobiana de H(x,?/) = F(G (x,y)) no ponto (x, y) = (1,1).
[20] Sejam f(?x,?;) = (tg(u — l),u^ —v'^) e g(x,y) = — y). Calcule
f o g e D (fo g )(l, 1).
[21] Sejam f{u,v,w) = cos(?; 4- ?í ) -I- sen(?í 4- u -f w)) e g(x,y) =
(e^,cos(y —x),e~y). Calcule f o g e D{f o g)(0,0).
[22] Sejam T : R" —>• R’" e S : R”* —>■R* transformações lineares definidas,
respectivamente, por T (x ) = 4l • x e S(y) = R • y, com A uma matriz
m X n e B uma matriz m x k . Mostre que a composição

R = S o T ; R" ->■ R*

também é uma transformação linear e que a matriz associada a R é


dada por C = B-A. Moral do exercício: compor transformações lineares
corresponde a multiplicar as matrizes que as definem!
282 Aproximação linear e a regra da cadeia

[23] Considere w uma função de para R^ de classe r = y —x, s — y + x


e F{x,y) = w{r{x,y),s{x,y)). Calcule õF/ dx e dF/ dy em termos de
dw/dr e dw/ds.
[24] Considerei/ = f {x, y), g(5,í) = [gi{s,t),g2{s,t)) e h{s,t) = (/o g )(s,t).
Use a regra da cadeia para obter uma expressão para dh/ds e dhfdt
em termos das derivadas parciais de / , e 52- Assuma que / , e ^2
são funções de classe C^.
[25] Considere u = f { x, y, z ) , g(r,5,t) = {gi{r,s,t),g 2{r,s,t),g^{r,s,t)) e
//(r, s, í) = ( / o g)(r, s, t). Use a regra da cadeia para obter uma ex­
pressão para dhjdr^ dhjds e dhjdt em termos das derivadas parciais
de / , gi, ^2 e 33. Assuma que / , 52 e ^3 são funções de classe C^.
[26] Considere u = f {x, y), ^{v,s,t) = {gi{r,s,t),g 2{r,s,t)) e h{r,s,t) =
(/ ^ Use a regra da cadeia para obter uma expressão para
dh/dr^ dh/ ds e dh/dt em termos das derivadas parciais de / , g\ e p2-
Assuma que / , 51 e 52 são funções de classe C^.
[27] Seja 2; = /(x , y) uma função de classe C^. Sejam também x = g[u^ v) =
V cos(7T+ 1/) + e 1/ = h{u^ v) = — v^. Sabendo que

( - 1 .- 4 ) = 3
dx

determine {dF/du)[Q, 2) e [dF/dv){^, 2) da função composta F[u, v) =


f{g{u, v),h{u,v)).
[28] Seja / : R^ R uma função de classe tal que /i( 0 ,0,0) = 2,
fy{0,0,0) = fz{0,0,0) = 0. Se g{u,v) = f { u - v,v? - l , 3 v - 3),
calcule 5„(1, 1) e y„(l, 1).
[29] A resistência à retirada de um prego indica sua força de adesão à ma­
deira. Uma fórmula empírica para pregos comuns é

P = 2433.5

em que P é a resistência à retirada máxima em kg, 5 é a gravidade


específica da madeira a 12% de umidade, R é o raio do prego (em cm)
e D é a, profundidade (em cm) da penetração do prego na madeira.
Um prego Cd comum de 5 cm de comprimento e 0.28 cm de diâmetro é
completamente introduzido em pedaço de abeto Douglas, cuja gravidade
7.6 Exercícios 283

específica é 0.54. (a) Use a equação da aproximação linear de P para


aproximar a resistência máxima à retirada. Nas aplicações, apenas um
sexto dessa resistência é considerado seguro, para longos períodos de
tempo, (b) Quando os pregos são fabricados, R e D podem variar por
±2%, e a gravidade específica de diferentes amostras de abeto Douglas
pode variar por ±3%. Use a equação da aproximação linear de P para
obter uma aproximação do erro percentual máximo no valor calculado
de P.

[30] A resistência total R de três resistores i?i, i?2 e i?3, ligados em paralelo,
é dada por

1 -2 . _L 2.
R Ri i?2 R3
Se as medidas de /?i, i?2 e R^ são 100, 200 e 400 ohms, respectivamente,
com erro máximo de ±1% em cada medida, aproxime 0 erro máximo
no valor calculado de R através da equação da aproximação linear.

[31] A resistência elétrica R de um fio é diretamente proporcional ao seu


comprimento e inversamente proporcional ao quadrado do seu diâmetro.
Sabendo que 0 comprimento é medido com um erro possível de ±1%
e o diâmetro é medido com um erro possível de ±3%, aproxime o erro
máximo no valor calculado de R através da equação da aproximação
linear.

[32] O fluxo sangüíneo através de uma arteríola é dado por F = n P R ^ / (8 vl),


em que I é o comprimento da arteríola, R é 0 raio, P é a diferença
de pressão entre as duas extremidades, e v é 3. viscosidade do sangue.
Suponha que v e I sejam constantes. Use a equação da aproximação
linear para aproximar a variação percentual no fluxo sangüíneo se o
raio decresce 2% e a pressão aumenta 3%.

[33] Se um remédio é ingerido por via oral, o tempo T durante 0 qual a


maior quantidade do remédio permanece na corrente sangüínea pode
ser calculado com 0 auxílio da meia-vida x do remédio no estômago e
a meia-vida y do remédio na corrente sangüínea. Para muitos remédios
comuns (como a penicilina), T é dado por

xy (ln(x) - ln(y))
T=
ln(2) { x - y )
284 Aproximação linear e a regra da cadeia

Para um certo remédio, x = 30 min e y = 60 min. Se o erro máximo na


estimativa de cada meia-vida é ±10%, use a equação da aproximação
linear para estimar o erro máximo no valor calculado de T.
[34] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : R é uma função de classe tal que
Df { 0 , 0 , 0 ) = [ 0 0 0 ]
para todo {x,y,z) E então f { x , y , z ) = 0 para todo (x,y,z) E

(b) Se / : —>■R é uma função de classe tal que


Df{x,y,z) = [ 0 0 0 ]
para todo (x, y, z) E R^, então f { x , y , z ) = 0 para todo (x,y,z) E
R3.
*(c) S e / : R ^ —>-Ré uma função de classe tal que
Df{x,y,z) = [ 0 0 0 ]
para todo (x, y, z) € R^ e / ( 0 ,0,0) = 0, então f [ x , y , z ) = 0 para
todo {x,y,z) E R^.
[35] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se f : D C é uma função de classe definida no conjunto
aberto
D = { { x, y , z ) e R^ I a: < l} U { { x, y, z ) € R^ | x > 2}
tal que
Df { x , y , z ) = [ 0 0 0 ]
para todo (x, y, z) em R^, então /(x , y,z) = 0 para todo (x, y, z) E

(b) S e / : D c —í- R é uma função de classe definida no conjunto


aberto
D = {(x,2/, z) e R^ I X < l} U {(x,j/, z) G R^ | x > 2}
7.6 Exercícios 285

tal que
Df { x , y , z ) = [ 0 0 0 ]
para todo (x, y, z) em e / ( 0 ,0,0) = 0, então /(x , y,z) = 0 para
todo (x, y, z) G
[36] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : ^ R é uma função de classe satisfazendo
D/(0,0,0)= [ 2 0 0 ]
então /(x , y,z) = 2 x para todo (x,y, z) € R^.
(b) Se / : R^ —>■R é uma função de classe satisfazendo
Df { x , y , z ) = [ 2 0 0 ]
para todo (x,y,z) G então /(a :,y^z) = 2x para todo (x,y,z) G

* (c) Se / : > R é uma função de classe satisfazendo


Df { x , y , z ) = [ 2 0 0 ]
para todo (x,y, z) € R^ e / ( 0 , 0,0) = 0, então / ( x , y,z) = 2x para
todo (x, y, z) G R^.
[37] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : D C R^ ^ R é uma função de classe definida no conjunto
aberto
D = {(x,y,z) G R^ I X < 1} U {{x,y,z) G R^ | x > 2}
satisfazendo
Df { x , y , z ) = [ 2 0 0 ]
para todo (x,y, z) no domínio í?, então /(x,y, 2;) = 2x para todo
(x, y, z) e D.
(b) Se / : D c R^ —>■R é uma função de classe definida no conjunto
aberto
286 Aproximação linear e a regra da cadeia

D = {{x, y, z) G I x < 1} U {{x,y,z) E R^ | a: > 2}


satisfazendo
Df{x,y,z)=[ 2 0 0 ]
para todo (x, y, z) no domínio D e /(O, 0, 0) = 0, então /(x, y, z) =
2 X para todo (a:, y, z) E D.
[38] (Funções hom ogêneas) Dizemos que / : R’^ -> R é uma função ho­
mogênea de grau k se
/ ( í - x ) = í^ - / ( x ) , (7.22)
para todo x G R" e pra todo í > 0.
(a) Dê exemplos de funções homogêneas de grau 1 e 2 definidas em R^.
(b) Dê exemplos de funções homogêneas de grau 3 e 4 definidas em R^.
(c) f{x\, X2) = x \ x 2 + 8 x1X2 + x | é uma função homogênea?
(d) Para a função / do item anterior, mostre que

X2) + X2 ^ ( ® l i ® 2) = 3/(X i , X 2 ),

para todo (xi, X2) 6 R^.


(e) /(x i, X2) = 4 xfx2 —5 xiXj é uma função homogênea?
(f) Para a função / do item anterior, mostre que existe (xi,X2) G R^
tal que
^f ^f
^ (2 ^ 1 , X2) + X2 ^ ( ® i i 2^2) / k / ( x i , X 2 ),

para todo A: G R.
(g) (T eorem a de E uler) Mostre que se / ; é uma função
homogênea de grau A:, então
df
; ^ ( x ) + X2 ; ^ ( x ) + + ^ n ^ ( x ) = A:/(x),
dxi UX2
para todo x E
Funções homogêneas aparecem naturalmente em Economia. Por exem­
plo, funções de lucro e de custo (que surgem a partir de funções de
produção), e funções de demanda (que surgem a partir de funções
de utilidade), são automaticamente funções homogêneas nos modelos
econômicos tradicionais. O capítulo 20 da referência [71] oferece um
excelente estudo de funções homogêneas no contexto econômico.
7.6 Exercícios 287

*[39] Sejam z = f{u,v), g(x,y) = {gy{x,y),g2{x,y)) e h{x,y) = {fog){x, y).


Mostre que

d‘^ h. , d‘^ f . , ,, ( Qqx ,


^ ( p ) = ã ^ f e ( p ) ) ■( ã í +

g (g ( p ) ) ( ^ ( p ) ) '+

| f e ( P ) ) - ^ { p ) + |{ t e ( p ) ) - ^ ( p ) .

, X / XX ^51/ X % 1 / X ,

ay ^ g i, ^ g i,
' dudv (g(p)) ■( "ôa;
^ ( P ) • ^dy( P ) + ^ay( P ) • ^aa;( P ) ) +

ay

■â;(p> +

^dy( P ) g fe (P )) ( f ( P ) ) %

|^ (s(p)) ■(|^ (p )) +

lí(g(p))
du ■i§(p)
dy‘^ + f{(s(p)) ■i§dy^( p ) ,

onde / , yi e y2 são funções de classe C^.


288 Aproximação linear e a regra da cadeia

[40] (O m étodo de N ew ton) Em Cálculo I você estudou o método de


Newton como um algoritmo com a finalidade de aproximar uma raiz de
& função real de uma variável, isto é, aproximar um número real p tal que
f[p) = 0, com A idéia do método é muito simples. A partir
de uma aproximação inicial xq, calculamos a equação da reta tangente
ao gráfico de / no ponto xq,

y = l(x) = /(xo) + f{xo){x - Xo).

Observe que encontrar uma raiz da aproximação I é mais fácil do que


encontrar uma raiz da função original /:
f{xo)
y = l(x) = /(x o ) + / ' ( x o ) ( x - Xo) ^ X = Xo -
f{xo)'
O número xi = xq —f{xo)/f'ixo) é uma outra aproximação da raiz p
de / (estamos supondo, evidentemente, que f{xo) ^ 0). Basta agora
repetir o processo, trocando xq por xi para calcular X2, e assim por
diante. Espera-se que a seqüência gerada por esta construção convirja
para a raiz p de / .

O método de Newton pode ser generalizado para funções vetoriais do


tipo
F: W ->R^,
seguindo a mesma construção do caso escalar. A partir de uma apro­
ximação inicial Xq, calculamos a equação da aproximação (afim) de F
no ponto Xo,

y = l(x) = F(xo) + í?F(xo)(x - Xo),

onde DF(xo), de tamanho n x n, é a matriz jacobiana de F no ponto xq.


Observe que encontrar uma raiz da aproximação 1 é mais fácil do que
encontrar uma raiz da função original F:

F(xo) + I?F(xo)(x - Xo) = 0 £>F(xo)(x - xo) = -F(xo) ^


X - Xo = -[DF(xo)]"^F(xo) =^x = xq- [Z?F(xo)]“^F(xo).
O ponto Xi = Xo —[DF(xo)]” ^F(xo) é uma outra aproximação da raiz p
de F (estamos supondo, evidentemente, que a matriz DF(xo) seja in-
versível). Basta agora repetir o processo, trocando xo por xi para cal­
cular X2, e assim por diante. Duas observações:
7.6 Exercícios 289

(1) No caso escalar, a derivada f'{p') é um número e, portanto, faz


sentido dividir por f{p). No caso vetorial, a derivada é uma matriz
e, portanto, a divisão é substituída pelo uso da inversa. Se usarmos
a notação

a fórmula de iteração para o caso vetorial fica muito parecida com


o caso escalar.
(2) Numericamente, dado o ponto xq, não se calcula o ponto x i pela
fórmula
Xi = Xo - pF(xo)]"^F(xo),
pois calcular a inversa de uma matriz é computacionalmente caro.
O que se faz é resolver o sistema linear (algo mais barato):
DF(xo)z = -F (x o )
e, então, tomar Xi = xq + z.
O método de Newton é uma manifestação de uma idéia central na te­
oria de Cálculo II: para se resolver um problema não-linear (em geral
muito difícil), o que se faz é tentar simplificar o problema com uma
aproximação linear (o papel da derivada é fundamental nesta parte),
resolver o problema no caso simplificado (algo mais fácil de se fazer) e,
então, relacionar a solução do problema simplificado com a solução do
problema original.
Naturalmente, a exemplo do caso escalar, a seqíiência gerada pelo mé­
todo de Newton vetorial pode não convergir. Não estudaremos, aqui,
questões de convergência, testes de parada e detalhes de implementação.
Indicamos, ao leitor interessado, as referências [30, 34, 61].
(a) Seja F(xi, X2) = {x^ + x^ — 1^X2 —sen(xi)). Calcule os três primei­
ros elementos da seqíiência gerada pelo método de Newton para a
função F, usando xq = (1,1) como tentativa inicial.
(b) Mostre que se F : —> R é uma função de classe e a seqíiência
Xjfc gerada pelo método de Newton para F é convergente, então Xk
converge para uma raiz p de F. Dica: mostre que x^ satisfaz
Kk+i = Xfc - [L>F(xfc)]"^F(xjfc),
para todo > 0 e, então, tome 0 limite para A; —> 00 dos dois lados
desta equação.
Capítulo 8

Derivadas direcionais e o vetor


gradiente

8.1 Derivadas direcionais

Considere a função de Cobb-Douglas z = /{x^y) = A - estudada


no exemplo (5.1). Lembramos que este tipo de função pode ser usada, por
exemplo, para modelar a produção de uma empresa em termos do capital x e
do trabalho y. Neste exemplo, vimos que com capital x* = 10000 e trabalho
y* z= 625, a produção desta firma éde z* = /(x*, y*) = 20000 unidades e que
as derivadas parciais de / com relação a x e y são dadas por

1^(10000,625) = 1.5 ^(10000,625) = 8.


oy

O valor (9 //9 x ) (10000,625) = 1.5 indica que se a quantidade de trabalho y*


é mantida constante e aumentamos a quantidade de capital x* em h unidades,
então a produção sofrerá um aumento de aproximadamente 1.5 • h unidades.
Analogamente, o valor (9 //9 y )(10000,625) = 8 indica que se a quantidade
de capital x* é mantida constante e aumentamos a quantidade de trabalho y*
em h unidades, então a produção sofrerá um aumento de aproximadamente
8 • h unidades. Para esta empresa, no ponto (x*,j/*) = (10000,625), entre
aumentar o capital ou aumentar o trabalho, é mais produtivo aumentar o
trabalho.
Contudo, você poderia se perguntar: por que manter uma variável cons­
tante e aumentar a outra? Afinal, esta não é a única estratégia possível! Por
exemplo, não seria mais produtivo aumentar as duas variáveis ao mesmo
292 Derivadas direcionais e o vetor gradiente

tempo em uma certa proporção? A resposta é que, de fato, existe uma


estratégia mais produtiva do aquela sugerida pelas derivadas parciais no
exemplo acima.
O objetivo deste capítulo é justamente tentar estabelecer um método
para se encontrar esta estratégia mais produtiva. Para isto, é conveniente
colocarmos uma linguagem mais geométrica para o que queremos fazer. Dada
uma função / : D C M e p = (a, 6) um ponto interior de D, vimos no
capítulo 5 que as derivadas parciais

dx (P)

representam, respectivamente, a taxa de variação de / quando mantemos


y = b constante e variamos x perto de a e a taxa de variação de / quando
matemos x = a constante e variamos y perto de 6.
Geometricamente, para a derivada parcial (9//(9x)(a, 6), o que estamos
fazendo é caminhar no domínio D da função / por uma reta passando pelo
ponto p = (a, b) que é paralela ao eixo x e analisando o comportamento de /
sobre esta reta. Para caminhar por esta reta, basta considerar o traço da
curva parametrizada

0^1 (í) = p + í • 0i = (a, 6) + í • (1,0) = (a + í, 6)

que justamente descreve a reta que passa pelo p = (a, 6) com direção dada
pelo vetor ei = (1,0) (veja a seção (2.5)) e, para analisar o comportamento
de / sobre esta reta, basta estudar a função composta de uma única variável
dada por

h{t) = { f o a i ) ( í) = / ( a i ( í ) ) = f { a + 1,6).

Com esta terminologia,

/(p + 1 • ei) - /(p) ^ /(g + 1, ò) - /(g, ò)


í —>0 t t—
¥0 ~t

Veja a figura (8.1).


8.1 Derivadas direcionais 293

0 -- -- 0

/l=/0CXj

Figura 8.1: Derivada direcional de / no ponto p = (a, b) na direção do vetor ei = (1,0).


294 Derivadas direcionais e o vetor gradiente

Analogamente, para a derivada parcial (9 //9 y )(a, 6), o que estamos fa­
zendo é caminhar no domínio D da função / por uma reta passando pelo
ponto p = (a, 6) que é paralela ao eixo y e analisando o comportamento de /
sobre esta reta. Para caminhar por esta reta, basta considerar o traço da
curva parametrizada

^2(^) = p 1 • G2 — 6) + í • (0,1) = (a, ò + t)

que justamente descreve a reta que passa pelo p = (a, b) com direção dada
pelo vetor 62 = (0,1) (veja a seção (2.5)) e, para analisar o comportamento
de / sobre esta reta, basta estudar a função compoata de uma única variável
dada por

h{t) = ( / o 0 2 ) (í) = /(a 2 (í)) = f {a, b + t).

Com esta terminologia,

df dh. /(« 2 (í)) - /(a2(0))


— (a, b) = — (0) = lim
dy^ dV ' t->0 í
/(p + 1 • 62) - /(p ) ^ /(g ,ò + t) - / ( g , b)
í—
>^0 t t—
^0 t
Veja a figura (8.2).
Em resumo, a estratégia de se mudar uma variável de cada vez corres­
ponde, geometricamente, ao fato de que estamos caminhando por uma reta
passando pelo ponto (a, b) e paralela a um dos eixos coordenados, isto é, esta­
mos caminhando por uma reta passando pelo ponto (a, b) cujo vetor diretor
é da forma ei = (1,0) ou 62 = (0,1) (estes vetores são denominados vetores
da base canônica de
Fica claro agora como podemos obter outras estratégias: basta tomar
retas passando por p = (a, 6) mas com uma direção arbitrária. Mais espe-
ciíicamente, queremos caminhar no domínio D da função / por uma reta
passando pelo ponto p = (u, ò), cuja direção é dada por um vetor diretor
V = pré-estabelecido e analisar o comportamento de / sobre esta'
reta. Para caminhar por esta reta, basta considerar o traço da curva para­
metrizada

Oi{t) = p + í . V = (a, 6) + t • (?;i,V2) = [a + t • v i , b + t • V2)


8.1 Derivadas direcionais 295

«2
0 -- -- 0

h=fooi^

Figura 8.2: Derivada direcional de / no ponto p = (a, b) na direção do vetor e 2 = (0,1).


296 Derivadas direcionais e o vetor gradiente

que justamente descreve a reta que passa pelo p = (a, 6) com direção dada
pelo vetor v = (vi, V2) (veja a seção (2.5)) e, para analisar o comportamento
de / sobre esta reta, basta estudarm a função composta de uma única variável
dada por

h{ t ) = ( / o a )(í) = f { a { t ) ) = f { a + t - v i , b + t - V2).

Com esta terminologia,

dV ’ t^o t
lim / ( P + ^'^) ~ / ( P ) ^ lim ^ b + t-V 2) - f{a, b)
t^o t í-^O t
0 número real

dv <->o t

é denominado a derivada direcional de / no ponto p = (a, 6) na direção do


vetor V = (t»i,U2)- Veja a figura (8.3).
Observe que, para calcular o limite

/ ( p + í • v) - /(p )
lim
í—^0
na definição de derivada direcional, é necessário que a (í) = p + í •v esteja no
domínio D de f para t próximo de zero. Para isto, é suficiente que p = (a, 6)
seja um ponto interior de D.
Evidentemente, a definição de derivada direcional dada acima se estende
para o caso de uma função escalar de n variáveis.

Definição! 8.1 (D erivada direcional ) Sejam f: D c W R


uma fiinçâo definida em um subconjjunto D dè K”, p um ponto interior
de £> e V um vetor em M”'. A derivada direcional de / no ponto p na
direção de v é definida por

(8 . 1)
dv^ ' Í-+0 t
caso o limite exista;
8.1 Derivadas direcionais 297

0 -- -- 0

/i=/ocx

Figura 8.3: Derivada direcional de / no ponto p = (a, b) na direção do vetor v.


298 Derivadas direcionais e o vetor gradiente

8.2 O vetor gradiente

Se / : í? C > R é uma função de classe p é um ponto interior


de D e \ é um vetor em R^, então podemos calcular a derivada direcio­
nal (9//9v)(p ) de uma maneira mais fácil e direta do que tentar calcular o
limite em (8.1) diretamente. Para isto, vamos introduzir um objeto impor­
tantíssimo na teoria de otimização: o vetor gradiente.

' D efinição 8.2 (O v e t o r g r a d ie n t e ) Considere uma função es­


calar / : D C R de olassè C^ e p um ponto dò domínio D de / .
O vetor gradiente de / no ponto p é o vetor

0 campo pradieníe de / é a fonção vetorial

, i O símbolo V é deaommado nablà.

Teorenía,6;l Sejam / : D C R uma fimção ;de classe defi­


nida em um subconjunto D de R'*^ p um ponto mtérior de Í> e v um
vetor erã M*. Então s

||( P ) = v / ( p ) . V = ^ ( p ) + ^ (p ) . (8.3)

isto é, a derivada direcional (d//dv)(p) de / em p na direção v é o


produto interno {veja a definição (2.1)) entre o vetor ^adiente V /(p )
de / em p e o vetor v.

Demonstração: A demonstração é uma aplicação imediata da regra da ca­


deia. Se a (í) = p -1- í • V = (pi -t- í • u i,. . . , p„ + í • On) e ã = / o a então, por
definição, temos que

| ( p ) = '■'(O)-
8.2 o vetor gradiente 299

Mas, pela regra da cadeia,

Dh{0) = D {f o a)(0) = D /(a (0 )) • Z?a(0) = Df {p) ■Dct{Q),

isto é, em termos das entradas destas matrizes, concluímos que

1 ■ Vi “
ÊL
dx\ (P) dXn
(P)
. Ixn
_ _ nxl
df £>/
a * / ” ’ *’' + ■■■+ J 1x1

Por comparação, segue-se que

% { v ) = '•'(0) = ^ ( p ) ■-1 + ■■■+ ^ ( p ) ■»» = V / ( p ) . V.

Se estamos interessados em estudar a função / sobre a reta dada pelo traço


da curva parametrizada a (t) = p + 1 • v , então somos naturalmente levados
a estudar a derivada da função composta h = f o ol em í = 0, cujo valor
é justamente a derivada direcional {df/dv){p). Mas, por outro lado, se
w = 200 • V , então a curva parametrizada = p + t • w determina a
mesma trajetória (traço) da curva parametrizada a , mantendo-se o mesmo
sentido mas com velocidade diferente. Se estudarmos a função composta
g = f o p também estaremos estudando o comportamento de / sobre a
reta dada pelo traço de a (ou /3) e a derivada de g em t = Q também é
dada por uma derivada direcional: (9//9w )(p ). Qual é a relação entre estas
duas derivadas direcionais? Podemos obter esta relação usando o teorema
anterior:

^(r.^ V /(p ) • w = V /(p ) • (200 • v) = 200 • V /(p ) •V = 200 • ^ ( p )

onde, na terceira igualdade, usamos a propriedade (c) do teorema (2.2). Mo­


ral da história: retas passando por um mesmo ponto e com vetores diretores
com mesma direção e sentido podem determinar derivadas direcionais dife­
rentes! Desta maneira, se estamos querendo calcular a taxa de variação de
uma função sobre uma reta em seu domínio, então precisamos fixar uma
escala para os vetores diretores das retas. Faremos isto estabelecendo que
o vetor diretor de uma reta passando pelo ponto p deve possuir tamanho
300 Derivadas direcionais e o vetor gradiente

(norma) 1 quando queremos calcular a taxa de variação de uma função es­


calar sobre esta reta.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Derivadas direcionais podem ser calculadas para vetores de qualquer ta­


manho. Contudo, se você quiser usar derivadas direcionais para calcular
taxas de variação de uma função escalar / sobre a reta, passando pelo
ponto p no domínio de / na direção de um vetor v, você deve substituir
V por um vetor de mesma direção e sentido mas de norma (tamanho) 1.
Isto pode ser feito tomando-se

u=

conforme indicado na seção (2.4) do capítulo 2. Muitos autores só con­


sideram derivadas direcionais com vetores unitários.

Exercício resolvido 8.1 Considere a função de produção Cobb-Douglas

z = f { x, y) = 4 •

estudada no exemplo (5.1). Considere também os valores de capital x* =


10000 e trabalho y* = 625.

(a) Calcule a derivada direcional de / no ponto p = (a:*, y*) = (10000,625)


na direção do vetor v = (1,3).

(b) Calcule a taxa de variação de / no ponto p = (x*, y*) = (10000,625) na


direção do vetor v = (1,3).

Solução:

(a) No exemplo (5.1) vimos que (df/dx){p) = 1.5 e {df/dy){p) = 8, logo

Pelo teorema (8.1), segue-se que


8.2 o vetor gradiente 301

|{ ( P ) = V /(p ) • V = (1.5,8) • (1,3) = 1.5 • 1 + 8 • 3 = 25.5.

Observe que este resultado não é a taxa de variação de / em p na


direção v. Calculamos apenas uma derivada direcional.
(b) Como estamos querendo calcular uma taxa de variação, é preciso calcular
a derivada direcional de / em p na direção de um vetor u unitário (de
norma 1) com mesma direção e sentido de v. Assim,

V (1,3) (1,3) VlÕ 3 v ^


u =
„ ,1 V (Ij2T (3)2 ^/íõ V 7 íõ ’ VTõy \ 10 ’ 10

A taxa de variação de / em p na direção v é dada por

(p) = V /(p ) - u = (1.5,8)


au 10 ’ 10

, , ^ „ 3 ^ 5 1 ^ „
1.5 • + 8 •^ 7 — = — ^ 8.063__
10 10 20
Observe que o resultado acima também é a taxa de variação de / em p
na direção u. ^

O item (b) do exercício resolvido acima sugere uma estratégia mais produ­
tiva do que tentar manter o capital constante e variar o trabalho ou manter
o trabalho constante e variar o capital: no ponto p = (10000, 625), devemos
aumentar o capital e o trabalho na proporção 1/3. Contudo, uma outra per­
gunta surge: como saber se não existe uma estratégia ainda mais produtiva?
Como determiná-la? A resposta é dada mais uma vez pelo teorema (8.1)
junto com as propriedades de produto interno. Descobrir a estratégia mais
produtiva é equivalente a descobrir um vetor unitário u para o qual a deri­
vada direcional no ponto p é máxima. Agora, usando o teorema (2.3), temos
que

|^ ( p ) = V /(p ) • u ||V /(p )||-J|u ||.c o s(0 ) = ||V /(p )||-co s(0 )
= 1

(veja a figura (8.4)). Desta maneira, a fim de que a derivada direcional acima
seja máxima, devemos ter 0 = 0 de modo que cos{9) = 1. Moral da história:
302 Derivadas direcionais e o vetor gradiente

O vetor que fornece a direção de maior crescimento de uma função / em um


ponto p é o vetor gradiente V /( p ) de / em p e a maior taxa de crescimento
é dada por l|V /(p )l|, a norma do vetor gradiente de / em p, que nada mais é
do que a derivada direcional de / em p na direção do vetor gradiente V /( p ) .
Analogamente, o vetor que fornece a direção de maior decrescimento de uma
função / em um ponto p é o vetor —V /( p ) e a maior taxa de decrescimento
é dada por —||V /( p ) ||, que nada mais é do que a derivada direcional de /
em p na direção —V /( p ) . Vamos colocar estes resultados em um teorema.

Figura 8.4: Se ||u|| = 1, então (d//du)(p) = l|V/(p)|| • cos(^).

T eorem a 8.2 Considere / : D C R” ^ R uma função de classe ep


um ponto interior de i). Se V /(p ) ^ 0, então a direção de maior cres­
cimento de / em p é dada por V /(p ) (com uma taxa de crescimento
máxima igual a |[V /(p)||) e a direção de maior decrescimento de f
em p é dada por —V /(p ) (com uma taxa de decrescimento máxima
Ig u a la -IIV /(p )II).

Exercício resolvido 8.2 Considere a função de produção Cobb-Douglas

^ = 4•

estudada no exemplo (5.1). Considere também os valores de capital x* =


10000 e trabalho i/* = 625. Encontre a direção de maior crescimento da
produção / em p = (x*,y*) = (10000,625). Qual é a taxa de crescimento
de / em p nesta direção?
8.2 o vetor gradiente 303

S olução : A direção de maior crescimento de / no ponto p é dada pelo


vetor gradiente de / em p:

V /( p ) = (1 .5 ,8 ).

A taxa de crescimento de / em p nesta direção é dada por

l|V/(p)|| = V(l-5)" + 8" = 8.139....

Assim, se queremos aumentar a produção no ponto p = (10000,625) o mais


rapidamente possível, devemos aumentar o capital e o trabalho na proporção
1.5/8.

N otação. Existem outras maneiras de se especificar um vetor para o cálculo


de uma derivada direcional, além da notação

v = {vx,V2,...,Vn)

que estamos usando no texto. Por exemplo, podemos descrever v como uma
combinação linear dos vetores da base canônica em M":

V = ui •ei + Ü2 •62 + -------1- e„

onde

61 = (1 ,0 ,0 ,..., 0,0),
62 = (0 ,1 ,0 ,...,0 ,0 ),

6„ = (0 ,0 ,0 ,..., 0,1).

Assim, 0 vetor v = 2ei + 362 em nada mais é do que o vetor v =


2 (1,0) + 3 (0,1) = (2,3), enquanto que o vetor v = 2 6i + 3 62 + 4 63 em R^
nada mais é do que 0 vetor v = 2 (1,0,0) + 3 (0,1,0) + 4 (0,0,1) = (2,3,4).
Muitos livros, incluindo o volume de Cálculo Integral a Várias Variáveis
desta coleção, utilizam ainda uma outra notação:

V = ai + 6j = a (1,0) + 6 (0,1) = (a, 6)


304 Derivadas direcionais e o vetor gradiente

para um vetor em e

V = a i + 6j + c k = a (1,0,0) + 6 (0,1,0) + c (0,0,1) = (a, ò, c)

para um vetor em . Assim, o vetor v = 2 i + 3 j em R^ nada mais é do que


0 vetor V = 2 (1,0) + 3 (0,1) = (2,3), enquanto que o vetor v = 2i + 3j + 4 k
em R^ nada mais é do que o vetor v = 2 (1,0,0) + 3 (0,1,0) + 4 (0,0,1) =
(2,3,4).

8.3 Exercícios

[01] Encontre o gradiente das funções abaixo.


(a) f { x , y , z ) = y j ^ .
(b) /(x , y, z) = x y - V y z ^ xz.
(c) f { x , y , z ) = x + y~^ -\-z^.
(d) f{x, y, z) = xy"^ + yz^ + zx'^.
(e) /(x , y) = In ^ /x ‘^ + y^.
(f) y) = + y'^)\/x^ + y^.
(g) f { ^ , y ) = xe^''+y\
[02] Calcule a derivada direcional das funções abaixo no ponto e direção
especificados, onde ei = (1,0) e 02 = (0,1).
(a) f{x, y) = + y2 _ 3 xy^, p = (1,2) e v = (1/2, V^/2).
(b) f {x, y) = e^cosy, p = (0,7t/ 4) e v = (ei + 3e2)/\/ÍÕ-
(c) /(x , y) = 17 x^, p = (1,1) e V = (ei + e2)/V^.
(d) /(x , y) = p = (1, 7t/ 2) e v = (3 ei + 4 e2)/5.
[03] Calcule a derivada direcional das funções abaixo no ponto e direção
especificados, onde ei = (1,0,0), 62 = (0,1,0) e 63 = (0,0,1).
(a) f { x , y , z ) = x^ - 2 x y + 3 z2, p = (1,1,2) e V = (ej + 62 - 63)/\/3.
(b) f (x, y, z) = p = (1,10,100) e v = (1, - 1 , - l ) / \ / 3 .
(c) /(x , y, z) = sen(xyz), p = (1,1, tt/ 4) e v = (1/V^, 0, - 1 /v ^ ) .
(d) f ( x , y , z ) - l/{x^ + y'^ + z‘^), p = (2,3,1) e v = (e 2 -2 e 3 + ei)/\/6 .
8.3 Exercícios 305

[04] Determine a direção na qual cada uma das funções abaixo cresce mais
rapidamente no ponto p = (1,1).
(a) f { x, y) = x^ + 2y^.
(b) f { x, y) = x'^ - 2 y ^ .
(c) f { x , y) = e^seny.
(d) f { x , y) = e^seny — e~^cosy.
[05] Uma sonda espacial está nas proximidades do hemisfério mais quente
do planeta Mercúrio. Um sensor verifica que a carcaça da nave está
começando a derreter. Supondo que a temperatura na região é descrita
pela função T(x, y, z) = e~^ + e que a sonda se encontra na
posição p = (1,1,1), qual deve ser a direção que a sonda deve tomar a
fim de obter o maior decaimento na temperatura?
[06] A altura do vulcão havaiano Mauna Loa é (de maneira aproximada)
descrita pela função
h{x, y) = 2.59 —0.00024 —0.00065
onde /i é a altura acima do nível do mar em milhas e x e y medem
as distâncias leste-oeste e norte-sul em milhas com relação ao topo da
montanha. No ponto (x,y) = (—2, —4):
(a) O quão rapidamente cresce a altura na direção (1,1) (isto é, na
direção nordeste)?
(b) Em qual direção a altura cresce mais rapidamente?
(c) Em qual direção a altura decresce mais rapidamente?
(d) Se você caminhasse na direção sul, você estaria subindo ou des­
cendo? A que taxa?
(e) Se você caminhasse na direção noroeste, você estaria subindo ou
descendo? A que taxa?
[07] Suponha que uma montanha tenha o formato de um parabolóide elíptico
z = c— onde a, 6 e c são constantes positivas, x e y são as
coordenadas leste-oeste e norte-sul no mapa e z é a. altitude acima do
nível do mar {x, y e z são todas medidas em metros). No ponto (1,1)
qual é a direção em que a altitude cresce mais rapidamente? Se uma
pedra você largada em (1,1) em qual direção ela deveria começar a
rolar?
306 Derivadas direcionais e o vetor gradiente

[08] Sejam f e g funções com derivadas parciais contínuas. Justifique porque:

(a) V (/ + 5) = V / + V5.
(b) V(c • / ) = c • V /, onde c é uma constante real.
(c) V (/3) = /V 5 + 5 V /.
(d) V (//ff) = { g Vf - f Vg)/ g^ nos pontos onde g ^ 0.
[09] Em qual direção e sentido deveríamos nos mover a partir do ponto (2,3)
para aumentar o valor de 4 x^y o mais rapidamente possível? Expresse
sua resposta como um vetor de comprimento 1.
[10] A figura (8.5) mostra uma porção de um mapa da região sul de Minas
Gerais onde estão indicadas as curvas de nível da função altura h com
relação ao nível do mar. Existe uma linha grossa para cada 100 m de
elevação e uma linha fina em cada intervalo de 20 m. Considere os
pontos D e E no mapa. As setas indicam o vetor gradiente
de h no ponto indicado. Diga se as relações abaixo são verdadeiras ou
não, marcando um ‘‘V” se a relação for verdadeira e um ccp» se ela for
falsa.

( ) h{C) = HE) , ( ) h(A) > HC),

> >
( ) > 0, 0,

( ) < 0, () < 0,

( ) > 0,
() < 0,

( ) >
() >

[11] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : R é uma função de classe tal que V /( 0 ,0,0) =
(0,0,0) para todo (x,j/,z) G então f{x^y^z) = 0 para todo
{x,y,z) e
8.3 Exercícios 307
308 Derivadas direcionais e o vetor gradiente

(b) Se / : —> R é uma função declasse tal que Vf {x^y^z) =


(0,0,0) para todo (x^y^z) G R^, entãof{x^y^z) = 0 para todo
\x, y, z) G R^
* (c) Se / : R^ R é uma função declasse tal que Vf {x^y^z) =
(0, 0,0) para todo {x^ y, z) G R^ e /(O, 0,0) = 0, então f{x, y^z) = 0
para todo (x^y^z) G R^.
[12] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : D C R é uma função de classe definida no conjunto
aberto
D = {{x^y^z) I a: < l } U {(a;,3/,^) G R^ \ x > 2}
tal que Vf {x^y^z) = (0,0,0) para todo (x^y^z) em R^, então
f {x^y, z) = 0 para todo [x^y^z] G R^.
(b) Se / : D C R^ — R é uma função de classe definida no conjunto
aberto
D = [[x, y, z) G R^ I X < 1} U {{x,y,z) G R^ | x > 2}
tal que V/(o;, y, z) = (0,0,0) para todo (a;, j/, z) em R^ e / ( 0 , 0,0) =
0, então /(a:, y^z) = Q para todo (x, y, z)
[13] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se / : R^ ^ R é uma função de classe satisfazendo V /( 0 ,0,0) =
(2, 0, 0) então / ( x , y^z) = 2x para todo (x,y, z) G R^.
(b) Se / : R^ -> R é uma função de classe satisfazendo V /(x , y, z) =
(2,0,0) para todo (x ,y , z) G R^, então f{x^y, z) — 2 x para todo
(x ,y ,z) G R^
* ( c ) S e / : R ^ —> R é uma função de classe satisfazendo V /(x , y, z) =
(2, 0,0) para todo (x, y, 2;) G R^ e /(O, 0,0) = 0, então /( x , y, z) =
2 X para todo (a:, y, z) G R^.

[14] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
8.3 Exercícios 309

(a) S e / : D C é uma função de classe definida no conjunto


aberto
D = {{x, y, z) e M? I X < 1} U {{x,y,z) e | x > 2}
satisfazendo V /(x , j/, z) = (2, 0,0) para todo (x, y, z) no domínio D,
então /(rr, y^z) = 2x para todo (x, y, z) G I?.
(b) Se / : Z) C —> M é uma função de classe definida no conjunto
aberto
D = [{x^y,z) G I X < 1} U [[x,y^z) G | x > 2}
satisfazendo V /(x , y, 2:) = (2, 0,0) para todo (x, y, z) no domínio D
e /(O, 0, 0) = 0, então /(x , y^z) = 2x para todo (x, y, 2;) G D.
[15] Sejam u e v vetores em Mostre que se u • w = v • w, para todo
vetor w em R^, então u = v.
[16] Seja / : definida por /(x ) = ||x|p = x^x. Mostre que

V /(p ) = 2p.

Dica: escreva explicitamente h{t) = /( p + í • v) (use as propriedades de


multiplicação e transposição de matrizes), calcule h\0) = {df/dv){p)
e, em seguida, use o exercício anterior e o teorema (8.1).
* [17] Sejam A uma matriz m x n, b uma matriz m x 1, e x uma matriz n x 1.
Defina / : por

/(x ) = ||Ax - b||^ = (Ax - b)^(Ax - b).

Mostre que

V /(p ) = 2 ( A ^ A p - b ) .

'[18] Seja / : —>• R uma função de classe C^. Mostre que se a : R —)■R" é
uma curva parametrizada de classe C^, tal que a(0) = p e a'(0) = V e
h(t) = ( / o ct){t) (veja a figura (8.6)), então
dh. . d f, ,

Moral: na definição de derivada direcional, você pode substituir a reta


í i - > p + í- v p o r qualquer curva parametrizada de classe que, no
instante de tempo t = 0, passe por p com vetor velocidade v.
310 Derivadas direcionais e o vetor gradiente

0 - - -- 0

h=fooL

Figura 8.6; Se a (0 ) = p e a '(0 ) = v, então ( / o a )'(0 ) = ( ^ / / ^ ) ( p ) .

[19] (C am pos conservativos) Dizemos que F : ^ é um campo ve­


torial conservativo se existe / : R^ — R, tal que V /(x ) = F(x), para
todo X G R^.
(a) Mostre que F{x,y) = (y,x) é um campo vetorial conservativo.
(b) Em eletrostática, a força F de atração entre duas partículas de
cargas opostas é dada pela Lei de Coulomb:
F{x) = k-
|x||3‘
Mostre que F é um campo vetorial conservativo.
(c) Mostre que se F : —>■ é um campo vetorial conservativo de
classe C \ então

para todo (x,j/) G onde Fi e F2 são as funções coordenadas


de F.
Dica: use o teorema de Young.
(d) Use o item anterior para mostrar que 0 campo vetorial F(x,j/) =
(—j/, +x) não é conservativo.

No curso de Cálculo Integral de Funções de Várias Variáveis, você verá


que 0 trabalho realizado por um campo conservativo independe do ca­
minho.
8.4 Nota histórica 311

[20] Dizemos que / : E” R é uma função par se /(x ) = / ( —x), para todo
X € R". Mostre que se / : R" -> R é uma função par de classe C^, então

V / ( 0) = 0.

Dica; derive os dois lados de /(x ) = / ( —x) usando a regra da cadeia.

8.4 N ota histórica

O símbolo nabla (V) (também chamado de dei ou atled) foi introduzido por
William Rowan Hammilton em 1837, mas não com o objetivo de represen­
tar o gradiente de uma função. Na época, Hamilton usava o nabla para
simbolizar uma função arbitrária. Para denotar o gradiente de uma função,
Hamilton escrevia o nabla rodado de 90 graus. Alguns autores usam ainda
uma outra notação para o vetor gradiente:

grad/(x).

Esta notação foi introduzida por Maxwell e Riemann-Weber.


Capítulo 9

O teorema da função implícita

Neste capítulo vamos estabelecer um teorema fundamental na teoria de


cálculo diferencial de funções de várias variáveis: o teorema da função im­
plícita. Dada uma função F e dado um ponto p em um conjunto de nível
de F, o teorema da função implícita garante, sob uma certa hipótese, quando
este conjunto de nível de F é o gráfico de uma outra função f em uma
vizinhança do ponto p. Com isto, podemos aplicar toda a teoria desenvolvida
para gráficos no estudo de conjuntos de nível de funções. Por exemplo, já
sabemos como encontrar a equação do plano tangente ao gráfico de uma
função / : R de duas variáveis. Com este conhecimento e com o uso
do teorema da função implícita, vamos deduzir a equação do plano tangente
à superfície de nível de uma função F : R^ R de três variáveis.

9.1 O teorem a da função im plícita para

Exem plo 9.1 Considere a função escalar de duas variáveis dada por

F: ^ R
{x,y) Hf z = F(x, y) = 4 x + 2y '

A curva de nível de F associada ao nível z = 5 pode ser representada como


o gráfico de uma função / : D C R —f R de uma variável? Neste exemplo, a
resposta é afirmativa! A curva de nível de F associada ao nível z = 5 nada
mais é do que a reta no plano cartesiano (veja a figura (9.1)) passando pelos
pontos (5/4,0) e (0,5/2), cuja equação é dada por

4:X + 2y = 5.
314 O teorema da função implícita

zii

Contradomínio de F

Figura 9.1: A curva de nível de z = F{x^y) = 4 x + 2y associada ao nível z = 5.

Claramente, esta curva de nível pode ser representada como o gráfico de uma
função / : R —> R de uma variável, a saber,

/: R R
X y = f{x) = —2x + 5/2 ^

uma vez que Ax + 2y = 5 ^ 2y = —4 x + 5 => y = —2x + 5/2. g

Exem plo 9-2 Considere a função escalar de duas variáveis dada por

F: R^ R
(x,y) z = F{x,y) = x'^ + y^ '

A curva de nível de F associada ao nível z = 1 pode ser representada como


0 gráfico de uma função / : í) C K —>■M de uma variável? Neste exemplo,
a resposta é negativa] A curva de nível de F associada ao nível z = 1 nada
mais é do que a circunferência no plano cartesiano de centro em (0,0) e raio 1
(veja a figura (9.2)). Desta maneira, para cada x entre —1 e 1, existem dois
valores de y para os quais x^ + y^ = 1, a saber.

y = —V T ^ x^.
9.1 o teorema da função implícita para 315

zii

o0

Contradomínio de F

Figura 9.2: A curva de nível de z = F{x, y) = associada ao nível z = 1.

Geometricamente, cada reta vertical x = com —l < k < +1, intercepta


0 desenho da circunferência em dois pontos. Logo, a curva de nível de F
associada ao nível z = 1 não pode ser o gráfico de uma função y = f {x) de
uma única variável. ■

Como o exemplo anterior nos mostra, a curva de nível de uma função de duas
variáveis (considerada como um todo, globalmente) nem sempre é o gráfico
de uma função de uma única variável. O que vamos fazer é tentar estudar
uma curva de nível de maneira local. Para isto, vamos “enfraquecer” nossa
pergunta: dada uma função F: Dp.C M de duas variáveis e dado um
ponto p = {xQ,yo) na curva de nível C = {(x,y) G Dp \ F[x,y) = k} de F
associada ao nível z = k^ existe uma bola aberta 5y.(p) de centro em p e
raio r > 0 de modo que o “pedaço” da curva de nível C nesta bola seja o
gráfico de uma função de uma única variável? A resposta é que isto depende
do ponto p = (xo, yo) escolhido sobre a curva de nível C\
Considere a circunferência = 1 que é a curva de nível de z =
F{x^y) = + 2/^ associada ao nível z = 1. Para o ponto p = (xo,j/o)
(\/2/2, \/2/2), existe uma bola aberta de centro em p, de modo que o
“pedaço” da circunferência nesta bola é o gráfico de uma função y = f{x)
316 O teorema da função implícita

de uma única variável definida em um intervalo aberto I. Observe que xq


pertence ao intervalo I e / { xq) = j/o (veja a figura (9.3)). Por outro lado, o
‘‘pedaço” da circunferência + j/^ = 1 em qualquer bola aberta de centro
em q = (l?0)j por menor que seja o seu raio, não pode ser o gráfico de
uma função y = f{x) de uma única variável pois, para k suficientemente
próximo de 1, com A; < 1, a reta x = k intercepta este “pedaço” da circun­
ferência em dois pontos (veja a figura (9.4)). Observe que o mesmo tipo de
comportamento ocorre para o ponto (-1 ,0 ).

Figura 9.3: A curva de nível + 2/^ = 1 em um a bola ab erta de centro em


P = (a:o,2/o) = (\/2 /2 , v ^ /2 ).

No caso da curva de nível -f- j/^ = 1 da função F(x,j/) = + y'^,


q = (1,0) e r = (—1,0) são os únicos pontos para os quais não é possível
escrever a curva de nível como gráfico de uma função y = f[x) em uma bola
aberta de centro em cada ponto, respectivamente. Geometricamente, se a
reta tangente à curva de nível em um ponto p não é paralela ao eixo y, então
é possível obter uma bola aberta de centro neste ponto, de tal modo que o
“pedaço” da curva de nível nesta bola é o gráfico de uma função y = f{x)
de uma única variável.
Na figura (9.5) temos o desenho de uma curva de nível C de uma função
de duas variáveis. Com exceção.dos pontos indicados, isto é, com exceção dos
pontos onde a reta tangente à curva de nível é paralela ao eixo y, podemos
9.1 o teorema da função implícita para 317

Figura 9.4: A curva de nível = 1 em um a bola ab erta de centro em


q = (1,0).

obter bolas abertas nas quais a curva de nível C se escreve como o gráfico
de uma função y = f(x) de uma única variável.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Por outro lado, se a reta tangente a uma curva de nível é paralela ao


eixo y, isto não significa que não é possível obter uma bola aberta,
de centro neste ponto, onde a curva de nível é gráfico de uma função
y = f{x). Para ver isto, considere a função de duas variáveis
F: R
{x,y) H- z = F{x,y) = x - y ^ '
O ponto p = (0, 0) pertence à curva de nível C de F associada ao nível
z = 0 e a, reta tangente a C em p é o próprio eixo y (veja a figura (9.6)).
Mas a curva de nível C é o gráfico da função

y = f(^x) — com X g R.

O que vamos fazer agora é tentar obter um critério algébrico que garanta
a existência de uma vizinhança de um ponto na curva de nível de uma
318 O teorema da função implícita

Figura 9.5: Uma curva de nível C de um a função de duas variáveis.

Figura 9.6: A curva de nível de 2: = F ( x , y ) = x — associada ao nível z = 0.


9.1 o teorema da função implícita para 319

função F de duas variáveis, na qual a curva de nível possa ser representada


como gráfico de uma função y = f{x) de uma única variável. Neste sentido,
considere o exemplo a seguir.

Exem plo 9.3 Seja F : —> R definida por z = F{x^y) = x^^ —Sxy + y^ —l.
E fácil de ver que o ponto p = (xq, j/o) = (4, 3) pertence à curva de nível

C = {(x,y) G R^ I F[x^y) = + 2/^ —7 = 0}

da função F associada ao nível z = 0. Suponha que exista uma bola aberta


de centro em p, de modo que o ‘‘pedaço” da curva de nível C nesta bola se
escreva como o gráfico de uma função derivável y = f (x) áe uma variável
definida em um intervalo aberto / que contém xq = 4. Desta maneira, /
satisfaz a equação

- 3 xf{x) + { f { x ) f - 7 = 0,

para cada x ^ I. Ao invés de tentar obter uma fórmula explícita para / (o


que significaria tentar resolver uma equação cúbica para /(x )), o que vamos
fazer é calcular a derivada de / no ponto xq = 4. Para isto, vamos derivar
os dois lados da equação acima, obtendo

2 X - 3 /(x ) - 3 /'(x ) X + 3 i f { x ) f /'(x ) = 0

OU, ainda.

(3 { f { x ) f - 3x ) f { x ) = 3 /(x ) - 2x,

para cada x G /. Supondo que 3 {f{x))‘^ — 3x é diferente de zero, podemos


isolar f'{x) na expressão acima, concluindo que

3 /(x ) —2x
/'(^ ) =
3 {f{x)f - 3 x ’

para cada x € /. Logo, em x = xq = 4, temos /( xq) = yo = 3 e

3 • /(4) - 2- 4 3-3-2-4 1
/'(4) = 3 . (/(4))2 _ 3 .4 3-32-3-4 15'
320 O teorema da função implícita

Uma vez que o gráfico de / coincide com a curva de nível C de F, podemos


calcular a equação da reta tangente à curva de nível C de F em p = (4, 3),
calculando a equação da reta tangente ao gráfico de / em xq = 4:

1 41 1
y==yo + f'{xo) ■(x - Xo) = 3 + — • (x - 4) = — + — • a;.

Como uma aplicação, suponha que x mude de xq = 4 para xi = 4.1. Qual


deveria ser o valor de yi a fim de que o ponto q = {xi^yi) = (4.1,yi)
também pertença à curva de nível C de F? Para responder a esta pergunta,
deveríamos resolver a equação cúbica

(4 .1 )2 -3 (4 .1 ) í/i + í/ ? - 7 = 0.

Por outro lado, podemos obter uma aproximação de y\ de maneira muito


fácil! Basta usar a equação da reta tangente à curva de nível C em p =
(aJo.yo) = (4,3):
41 1 41 1
” 15 + + T s'
Se você resolvesse a equação cúbica acima, você encontraria o número real

V4ÍÕ ( 1 ( V1794479\ n\
3/1 = — ^ ( “ 3 ( — 9 8 1 — ) '*’ 3 ) 3.006099656...

como uma de suas três raízes. ■

Vamos seguir a idéia sugerida pelo exemplo acima em um contexto mais


geral. Sejam F : -> R uma função de duas variáveis de classe e
P = (^Oj V o ) uni ponto na curva de nível

C ' = { ( x , j / ) e M ' \ F{x, y) = k}

de F associada ao nível z = k. Suponha que exista uma bola aberta de


centro em p, de modo que o ‘‘pedaço’’ da curva de nível C nesta bola se
escreva como o gráfico de uma função y = f{x) de classe de uma variável
definida em um intervalo aberto I que contém xq. Desta maneira, / satisfaz
a equação
F{x,f{x)) = k. (9.1)
9.1 o teorema da função implícita para 321

Como fizemos no exemplo (9.3), vamos derivar os dois lados desta equação
e calcular o resultado em x = xq. Mas, agora, para derivar o lado esquerdo
de (9.1), precisamos aplicar a regra da cadeia. Observe que se

a : / C R ->
X i-> a (x ) = (x,/(x))

então F{xjf{x)) = F{cx{x)) = [F o cx){x) é a composição de F com a .


Assim, a equação (9.1) é equivalente a
{ Fo a ) { x ) = k, (9.2)
para cada x E I. Em outras palavras, a equação (9.1) nos diz que a função
composta F o ol é igual à função constante k no intervalo aberto I. Con-
seqüentemente, a matriz jacobiana de F o a em xq (uma matriz 1 x 1) é igual
à matriz jacobiana da função constante k em xq (também uma matriz 1x1),
isto é,
D{F o a)(xo) = D{k){xo), (9.3)
Mas a matriz jacobiana da função constante k em xq nada mais é do que a
matriz nula: [ 0 • Por outro lado, a matriz jacobiana D { F ool){x {)) pode
ser calculada com a regra da cadeia:
D{F o a)(xo) = DF{ ol{xq)) • Da(xo) = DF{ xq, f{xo)) • Dot{xo)
= DF{xo,yo) • Da{xo) = DF{p) • Da{xo).
Mas
dF õF
DF{p) =
1x2

■a i(x o ) ' 1
Dot{xo) =
. 0!2{^o) . 2x1 . f i ^ o ) . 2x1

onde ai(x) = x e a 2{x) = /(x ) são as funções coordenadas de a . Desta


maneira,
dF. . dF . , 1
D{F o a)(xo) = DF{p) ■Da{xo) =
. 1x2 2x1
dF dF ,
^ ( P ) + ^ ( P ) • / (xo)
1x1
Da igualdade D( F o a)(xo) = D(k){xo), concluímos que
322 O teorema da função implícita

dF . , d F ,
D { F o a) { xo) = ^(p)+ g^(p)-/W = [0].xr
J 1x1

Portanto, da definição de igualdade de matrizes, segue-se que

f ( p ) + f ( p ) - / ' W = o.

Se (ôF/9y)(p) ^ 0 então

dF dF

/'(^o) = -
dF dF

Estas contas sugerem que a existência de uma função y = f { x ) , cujo gráfico


coincida com uma curva de nível C de uma função z = F { x , y ) em uma
vizinhança de um ponto p = ( x Q) 3/o) € C, está intimamente ligada ao fato
de { dF/ dy o) ( x q , yo) ser diferente de zero. Esta relação constitui o teorema
da função implícita.

,, Teorema 9 (O teorema- pA função i w l ÍOITA para 1^) Seja


D C R^^-"4^;R,úisà fuRçâd„de classe cdín ír > 1, deífinidá em
'um suhcònji^o de Suponha que p = (a?o,í/o) seja iiítt ponto
interior de p e cjue p = (aro,;po) ,pertença,à, curva de nível
; ' 0 . = ' { ( x , y j € D I F ( x , y ) =,*}

^ de F associpaHa-ào-nível s? M Se- • I '

^ 'ff '

então exisfe-uiUa função f : I c-R - f ® de èreese C?* definidá em um


. intm alo aberto I de;R tàl que

f - ^ ) F { x , /(aí))T== k para todo è 6 / (isto é, o ^áfico de / ! coincide com '


S í í a curvá de nível de F para x € /),
9.1 o teorema da função implícita para 323

(d) a derivada de / ao ponto arp pode ser calculada em termos das


derivadas parciais de F no! ponto {®o,í/o):

(®o,í/o)
dx
/ 'N )
dF

Nesta sitnação, dazenios qne a equação F{x, y) = k define implicita­


mente y como irnia fimção f à ç x em uma vizinhança do ponto (a?o, yo).

E x e m p lo 9.4 Seja F : ^ R definida por z = F{x,y) = —3 x y + y^ —7


e considere a curva de nível

C - {(a;,2/) € R^ | F{x,y) = - 3 x y + y^ - 7 = 0}

de F associada ao nível z = 0. O ponto p = (4,3) pertence a. C, F é uma


função de classe C°° e

1 ^ (4 ,3 ) = + 2x-3y = -1 ,
(x,y)={ 4 ,3 )

1 ^ (4 ,3 ) = - 3 x + 3y^ = 15.
(x,y)=( 4 ,3 )

Como {dF/dy){4, 3) = 15 ^ 0, pelo teorema da função implícita, existe uma


função / : / C R —>■R definida em um intervalo aberto I tal que

(a) 4 e /,
(b) F{x, f{x)) = 0 para todo x G /, isto é, x^ —3 x /(x ) -I- (/(x))^ —7 = 0
para todo x € I,
(c) /(4 ) = 3 e
(d) a derivada de / no ponto 4 pode ser calculada em termos das derivadas
parciais de F no ponto (4,3);
324 O teorema da função implícita

1
/'(4) =
15'

Este resultado coincide com aquele obtido no exemplo (9.3). ^

Exercício resolvido 9.1 Uma firma usa x horas de trabalho não-qualifica­


do e y horas de trabalho qualificado diariamente para produzir z = Q{x^y) =
60 unidades de um certo produto por dia. Desta maneira, com xq =
64 horas de trabalho não-qualificado eyo = 27 horas de trabalho qualificado,
esta firma produz 2880 unidades do produto por dia. Use a equação da reta
tangente à curva de nível

c = {(x,2/) e I ^ = 288o}

de Q associada ao nível z = 2880 no ponto p = (xq, yo) = (64,27) para obter


uma aproximação da quantidade de trabalho qualificado necessária para se
manter a mesma produção diária de 2880 unidades do produto, sabendo que
a firma pretende contratar uma hora adicional de trabalho não-qualificado.

S olução : A função Q é de classe o ponto p = (64,27) pertence à


curva de nível C e

^ ( 6 4 ,2 7 ) = 40a;-^/y^^ = 30,
(i,S/)=(64,27)

320
^ ( 6 4 ,2 7 ) =
dy (i,jí)=(64,27) "9“ '

Como (dQ/dy) (64,27) = 320/9 ^ 0, pelo teorema da função implícita, existe


uma função ç : 7 C M —>■M definida em um intervalo aberto I tal que

(a) 64 e 7,

(b) Q{x,q{x)) = 2880 para todo x E I, isto é, 60x^/^ = 2880 para


todo X E I,
(c) g(64) = 27 e
9.1 o teorema da função implícita para 325

(d) a derivada de q no ponto 64 pode ser calculada em termos das derivadas


parciais de Q no ponto (64,27):

30
9'(64) = -
dO, , 320 '32'
i r

Desta maneira, a equação da reta tangente ao gráfico de q no ponto xq =


64 e, portanto, a equação da reta tangente à curva de nível C no ponto
(®0)2/o) = (64:, 27), é dada por

27 27
y = yo + q'{xo) ■{x - xq) = 27 - — ■{x - 64) = • x + 81.

Usando esta equação para estimar a quantidade yi de trabalho qualificado


necessária para se manter a mesma produção de 2880 unidades diárias para
uma quantidade = xq + 1 = 64 + 1 = 65 de trabalho não-qualificado,
concluímos que

27 837
2/1 « • 65 + 81 = — = 26.15625.

Para obter a resposta exata devemos resolver uma equação mais complicada,
60 (65)2/3yJ/3 = 2880, cuja solução é dada por 2/1 = 26.17562__ g

Já sabemos quando uma curva de nível C de uma função F de duas variáveis


pode ser representada como 0 gráfico de uma função y = f{x) que depende
de X em uma vizinhança de um ponto (xo> 2/o) C. Por outro lado, podemos
nos perguntar sob quais condições podemos representar esta curva de nível
como o gráfico de uma função x = g{y) que depende de y em uma vizinhança
de {xo,yo). A resposta é dada em um teorema análogo ao teorema (9.1).

Teorem a 9.2 (O t e o r e m a d a f u n ç ã o i m p l í c i t a p a r a E^) Seja


F D C E^ —)■ E uma função de classe C*, com k > 1, definida em
um .subconjunto D de E^ Suponha que p = (a;o, 2/0) seja um ponto
interior de D e que p = (xq, 2/0) pertença à curva de nível
0 = { { x , y ) € D I F{x,y).= k}:
326 O teorema da função implícita

de iiP associada ao nível z = h. Se


IÍÍiÍiÍlB iliÍiiiliÍ|IÍÍÍM
yo) 7 ^0,
então fedste niaá toição g: I cM. -i- U à e classe definida em ura
inti^^lí) aberto I de E tal que

- (b)i F{g{y), y) = k p ^ a todo y Ç . 1 (isto é, o gráfico de g coincide com


ja curva dé nível de F para y € í ) ,

, a .derivada de g no pònto yQ pode ser calculada em termos das


■-deriiradás parciáis de F no çonto (:co> í/o): “

(®o,yo)
dy
9'{yo) = -
(®o,yo)

Ntóta situação, dizemos que a equação F{x, y) = k define implicita-


; rnente ar como umá função p de j/ em uma vizinhança do ponto (aro, yo)-

9.2 O teorema da função implícita para

Os cálculos que levaram ao teorema da função implícita para se esten­


dem facilmente para uma função escalar que depende de mais do que duas
variáveis.

T eo rem a 9 .3 (O t EORBm A DA punção IMPUÍCITA PARA E") Seja


\:/F : D C E**+^ - f È uma função de'classe Ç^, com ^ > 1 . Su-
?l;;f>õnha que p = (íc|,‘...,a;J^,y*) seja um ponto interior de D e que
> " > ' Í P . = - ( í C * , y*) pertença a hiperfícíe de nível

, .• . Fk = {(arj,,..~.,Xn, y) € i> 1 z = F{ xi y . . , , % , y) - k}
9.2 o teorema da função implícita para R" 327

de F associada ao nível z = h Se

dy
então existe uma função f . B C E” E de classe (7* dèfinída em
uma bola aberta B de E” tal que

(b) F{xi, . . . , a;„, /(iT i,. . . , £c„)) - k para todo {xi, . . . , % ) € -B,

(d) as derivadas parciais de / no ponto (sj, podem ser


calculadas em termos das derivadas parciais de F no ponto

ÔF
k ^ < -'
dxi( ~ dF

■*1 yy
dX2^^^ --^n) -
,< ^ y l

Õ F, .
9x„
dxS ^ " " ' - 9F, *

Nesta situação, dizemos que a equação F { x i t .. .^Xn,y) = k define im­


plicitamente y como uma função / de (a:i,, . . , Xn) em uma vizinhança
do ponto (ící, y*).

Exercício resolvido 9.2 Mostre que a equação Xi+Sx^-I-Sriy^—3 y^ar2 = 9


define implicitamente y como uma função / de (a:i,r2) em uma vizinhança
328 O teorema da função implícita

do ponto [x\,X 2,y*) = (1,0,1). Em seguida, calcule a equação do plano


tangente ao gráfico de / no ponto (a;|, x^Ç) = (1,0).

S olução : Os pontos {xi,X 2,y) que satisfazem a equação

xl + 3 x l + 8 xiy^ — 3 y^X2 = 9

nada mais são do que os pontos da superfície de nível

S = {(xi, X2,y) e \ z = F{xi,X 2,y) = xf + Sxj + 8xij/^ - 3y^X2 = 9}

da função de três variáveis z = F{xi,X 2,y) = xf + 3x2 + 8 x\y^ — 8 y^X2


associada ao nível z = 9. A função F é de classe C°°, o ponto (x*,X2,y*) =
(1,0,1) pertence à superfície de nível 5 e

3xi + 8y^ — +11)


=

6 X2 - 3 y^ = -3,
{xi,X2,y)={l,0,l)
dF
■ ^ ( 1 , 0 ,1 ) = 1 6x iy -9 y ^ X 2 = +16.
{xi,X2,y)={l,0,l)

Como { d F / d y ) { l , 0 , l ) = 16 7^ 0, pelo teorema da função implícita, existe


uma função / : B C M de classe C°° definida em uma bola aberta B
tal que

(a) (1 ,0 )6 5 ,

(b) F ( xi ,X2, / ( xi ,X2)) = 9 para todo (xi,X2) 6 B, isto é,

X? + 3 X2 + 8 X i ( / ( x i , X 2))^ - 3 (/(X i, X 2))^ X 2 = 9

para todo (xi, X2) € B,

(c) /(l,0) = le

(d) as derivadas parciais de / no ponto (1,0) podem ser calculadas em termos


das derivadas parciais de F no ponto (1,0,1):
9.3 Conjuntos de nível e hiperplanos tangentes 329

( 1, 0, 1)
n
^ (1 0 ) =
dx^ ’ ’ dF 16’
(1,0,1)
dy

(1,0,1)
K n 0) = 3
dx2^ ’ ^ dF = + l6 -

Desta maneira, a equação do plano tangente ao gráfico de / no ponto


(ij, xl) = (1,0) e, portanto, a equação do plano tangente à superfície de
nível S no ponto (x*, xl, y*) = (1,0,1), é dada por

isto é.
, 11 / 3 , 11 3 27

O bservação. O teorema da função implícita estabelece uma condição sufi­


ciente para a existência de uma função / de n variáveis, cujo gráfico coincide
com o conjunto de nível de uma função F de n+ 1 variáveis em um vizinhança
de um ponto do conjunto de nível de F. Por outro lado, ele não estabelece
uma fórmula explícita para / e não estabelece o tamanho da bola B na qual /
está definida. O que ele faz é descrever como obter as derivadas parciais de /
em termos das derivadas parciais de F, o que é suficiente para o estudo local
das propriedades do conjunto de nível de F.

9.3 Conjuntos de nível e hiperplanos tangentes

No capítulo 7 vimos como calcular a equação do hiperplano tangente ao


gráfico de uma função. O que vamos fazer nesta seção é obter a equação
do hiperplano tangente ao conjunto de nível de uma função escalar. E a
maneira de se fazer isto é tentar aplicar o teorema da função implícita paxa
330 O teorema da função implícita

“converter” um conjunto de nível em um gráfico de uma função. Para garan­


tir que esta “conversão” possa ser feita, devemos exigir que alguma derivada
parcial da função seja diferente de zero no ponto dado. Isto sugere a seguinte
definição.

D efin ição 9,1 (P onto regular) Sejam F: D C M uma


função de classe C*', com k > 1, Dizemos que p é ura ponto regu-
laj- de F se p está no interior de D e

VF(p) = (
b'>) ^ { 0 , 0 , . .
- ’ W,.
,0).

Em outras palavras, p é ponto regular de F se alguma derivada parcial


{dF/dxi){p) é diferente de zero. No caso de uma função F de para R,
p = {xq, yo) é um ponto regular se

N /o
(s^O) 3/o) ^ 0 OU — (xo,2/o)#0.

Com esta condição de regularidade, podemos aplicar o teorema da função


implícita para garantir que, em uma vizinhança de p, a curva de nível de F
que passa por p é o gráfico de uma função que depende de x se { d F / d y ) (p) ^
0 ou o gráfico de uma função que depende de y se (9F/9x)(p) ^ 0.
Já vimos que o gradiente de F aponta para a direção na qual F cresce o
mais rapidamente possível. Por outro lado, em uma curva de nível, o valor
de F permanece constante, isto é, F não sofre alteração alguma. Não é difícil
de se suspeitar que o gradiente seja perpendicular à curva de nível em um
ponto regular.

T eorem a 9.4 Seja P : D C R^ R uma função de classe C*, com


k > 1 Se p = («Oj J/o) é um ponto regular de P então o vetor gra­
diente V P (p ) é perpendicular ern p à' curva de nível dé P que passa

Demonstração: Se p = (xo,yo) é um ponto regular de P então

^F, .
ou — (xo,yo)7^0.
dx ^
9.3 Conjuntos de nível e hiperplanos tangentes 331

Vamos supor que [dF/dy){p) 7^ 0 (o caso [dF/dx){\>) 7^ 0 é análogo). Pelo


teorema da função implícita, existe / : / C M — M de classe tal que
xq E /, f{xo) = Ho e F{xjf{x)) = k = F(xo,j/o) para todo x E /. Mais
ainda, com o uso da função / , podemos construir uma curva parametrizada

OLi / C M —^
X t-4- a{x) = {ai{x),a 2{x)) = (x,f{x)) ’

cujo traço coincide com o gráfico de / e, portanto, também coincide com a


curva de nível de F que passa por p. Sendo assim (veja a figura (9.7)), a
condição

F{x, f{x)) = k para todo x E I

é equivalente a

g{x) = {F o a){x) = F{a{x)) — F[x, f{x)) = k para todo x E I.

Conseqüentemente, a matriz jacobiana de g — F o a em 2:0 (uma matriz


de tamanho 1 x 1) é igual à matriz jacobiana da função constante k em xq
(também uma matriz de tamanho 1 x 1), isto é, D{F o o:)(a;o) = D(k){xo).
Mas a matriz jacobiana da função constante k em xq nada mais é do que a
matriz nula: [ 0 ] . Por outro lado, a matriz jacobiana D(F o a)(a;o) pode
ser calculada com a regra da cadeia:
D{F o a)(xo) = DF{a{xo)) ■Da{xo) = D F { xq, / { xq)) ■Da{xo)
= DF{xo,yo) • Da{xo) = DF{p) ■Da{xo).
Mas

■d F , , d F , o;í(2:o)
DF{p) = e í)a(xo) =
1x2 . « 2(2:0) J_ 2x1
onde ai(a;) = x e oí2{x ) = f( x ) são as funções coordenadas de a. Desta
maneira.
dF. , dF. , « 1 ( 2:0 )
D{F o a)(xo) = D F { p ) • Da(xo) =
1x2 , « 2 ( 2:0 ) .J 2x1

|^ ( p ) • «i(a:o) + ^ ( P ) • " 2(2:0)


1x1
332 O teorema da função implícita

-- k

Figura 9.7: 0 vetor gradiente VF(p) é perpendicular ao vetor tangente


ol'(xq ) da curva C em p.

Da igualdade D{F o cí){xq) = D{k){xo)j concluímos que

D{F o a )(io ) = ^ { p ) ■a[{xo) + |^ ( P ) • o^iixo)


J 1x1

Portanto, da definição de igualdade de matrizes, segue-se que

|^(p) •«iw + ^(p) •“2 (2 :0 ) = 0 .


O lado esquerdo desta igualdade pode ser codificado vetorialmente, isto é,
ele representa o produto escalar entre 0 vetor gradiente V F(p) e o vetor
tangente ol'{xq) à curva de nível em p:

dF BF
V F(p) ■a'(xo) = ^ ( p ) • a[{x,) + ^ ( p ) ■a',{x,) = 0.

Mas, pelo teorema (2.3), V F(p) •a'(a:o) = ||V F (p)|| • ||a'(a:o)|| ■cos{0), onde
9 é o ângulo entre o vetores V F(p) e a'(xo). Portanto,

||V F (p )|| • ||a'(xo)|| • cos{9) = V F(p) • a'(xo) = 0.


9.3 Conjuntos de nível e hiperplanos tangentes 333

Uma vez que V F(p) ^ 0, pois p é um ponto regular de F e ol'{xq) ^ 0, pois


a'(xo) = (1, / '( xq)), segue-se que cos(0) = 0, isto é, o ângulo Q entre o vetor
gradiente e o vetor tangente é igual a tt/ 2 (veja a figura (9.7)). Portcinto,
o vetor gradiente V F(p) é perpendicular em p à curva de nível de F que
passa por p. h

O campo gradiente possui propriedades geométricas muito importantes.


Ele mostra qual é a direção na qual F cresce o mais rapidamente e ele é
perpendicular às curvas de nível de F , Estas duas propriedades são muito
razoáveis. Para ver isto, imagine uma montanha como na figura (9.8). Quem
já fez caminhadas sabe que, para se chegar ao topo da montanha o mais
rapidamente possível, deve-se caminhar perpendicularmente às curvas de
nível da montanha. Isto é consistente com os teoremas (8.2) e (9.4).
O teorema (9.4) vale também para funções escalares que dependem de
mais do que duas variáveis. Mais precisamente, vale o seguinte teorema:

T eorem a 9.5 Seja Dc R uma função de classe com


A; > 1. Se p é um ponto regular de F , então o vetor gradiente V F(p)
é perpendicular em p à hiperfícié de mvel
> f c - { x € Í ? l F ( x ) .: ^ A : ^ i ^ ( p ) }
de F que passa por p.

E xem plo 9.5 O ponto N = (0, 0,1) é o “pólo norte” da esfera S em

2 drV
, 2 d, 2 - 11.

Esta esfera pode ser representada como a superfície de nível da função


F(x,y, z) = ^ associada ao nível k = 1. Na figura (9.9) temos o
desenho da esfera S e vários vetores gradientes de F (que foram divididos
por 4 para facilitar a visualização). Como o teorema (9.5) afirma, cada vetor
gradiente V F(p) é perpendicular à esfera S no ponto p. Em particular, o
vetor gradiente no “pólo norte” é dado por V F(0,0,1) = (0,0,2), aponta
para o norte e é perpendicular à esfera em (0, 0,1). b
334 O teorema da função implícita

Figura 9.8: Uma ilustração física de dois fatos: (1) V F é a direção de maior
crescimento de F e (2) V F é perpendicular a suas curvas de
nível.
9.3 Conjuntos de nível e hiperplanos tangentes 335

Figura 9.9: A esfera = 1 em

Um hiperplano em fica completamente determinado se especificarmos


um ponto p por onde 0 hiperplano passa e um vetor normal n ao hiperplano
(veja a seção (2.6)). Uma vez que o vetor gradiente V F(p) fornece um vetor
normal (perpendicular) ao conjunto de nível de F que passa por p em p se p
é um ponto regular de F, podemos usá-lo para obter a equação de hiperplano
tangente ao conjunto de nível no ponto p:

V F(p) • (x - p) = 0 (9.4)

OU, em coordenadas,

dF / X / \ dF / \ / X dF / X / \ A
— (p) •(Xi - pi) + •. . + Õ ^ (P ) •[Xn - Pn) = 2 ^ ^ ( p ) •[Xi - Pi) = 0
^ 2=1 ^

onde X = (x i,. . . , x„) e p = (p i,... ,p^).


A figura (9.10) ilustra esta configuração geométrica para uma superfície
de nível de uma função F de três variáveis: a equação do plano tangente à
superfície de nível de F que passa pelo ponto p = {xo^yoi^o) p se p é
um ponto regular de F é dada por V F(p) • (x —p) = 0, isto é.
336 O teorem a da função im plícita

Figura 9.10: O plano tangente à superfície de nível um a função F de três


variáveis no ponto p.

d F . , . , dF d F , , , X ^
yo, zo) ■[x - xo) + — [xo, yo,zo)-{y-yo) + yo,zo)-[z- zq) = 0.

Exercício resolvido 9.3 Encontre a equação do plano tangente à superfície


de nível da função z = F{xi, X2, y) = x^ + Sx^ + S x\y"^ —3 y^X2 associada ao
nível z = 9 no ponto p = (1, 0,1).

S olução : Como

dF
^ (1 ,0 ,1 ) = 3x? + 8y2 — + 11,
{xi,X2,y)={l,0,l)
dF
(1,0,1) = 6x2-3?/=’ = -3,
dX2 {xi,X2,y)={l,0,l)

(1,0,1) = 16 xi?/- 9 í/^X2 — +16,


dy (xi,rc2,y)=(l,0,l)

segue-se que V F (1 ,0,1) = (11, —3,16) 7^ (0,0,0), isto é, p = (1,0,1) é um


9.3 Conjuntos de nível e hiperplanos tangentes 337

ponto regular de F. Portanto, a equação do plano tangente à superfície de


nível de F associada ao nível 2: = 9,

•^9 = {(a:i,a:2,y) € | F{xi,X 2,y) = x\ + i‘ x \ + - i“y^x^ = 9} ,

no ponto p = (1,0,1) G ^9, é dada por

V F (1 ,0,1) • ((xi, X2, y) - (1,0,1)) = (11, -3 ,1 6 ) • (xi - 1, rc2, y - 1) = 0,

isto é, 11 (xi —1) —3 12 + 16 (y —1) = 0. Podemos reescrever esta equação


na forma
11 3 27

O que coincide com a equação obtida no exercício resolvido (9.2). g

CUIDADO! CUIDADO! CUIDADO!

Considere as funções escalares / e F de duas e três variáveis definidas,


respectivamente, por
/: ^

(x,y) !->■ z = f{x ,y) = x^ + y^


e
F: M
(x,y,z) !->• = F (x ,y ,z) = - z + + y^.
O gráfico de / é o parabolóide elíptico de revolução estudado no exem­
plo (3.1). Por outro lado, este mesmo parabolóide elíptico de revolução
pode ser representado como a superfície de nível de F associada ao nível
w = 0. Qual é a relação geométrica entre o parabolóide, o vetor gradi­
ente V / de / e o vetor gradiente V F de F? O vetor gradiente V F(p)
calculado em um ponto p = {xo^yo^zo) do parabolóide é perpendicular
ao parabolóide em p, uma vez que o parabolóide é uma superfície de nível
de F e todos os pontos do parabolóide são pontos regulares de F. Por
outro lado, V / não é perpendicular ao parabolóide. De fato, Vf[x^y) é
um vetor em enquanto que o parabolóide é um objeto em R^! Logo,
as dimensões não estão compatíveis e, portanto, nem faz
338 O teorem a da função im plícita

sentido perguntar se V f i x ^ y ) é perpendicular ou não ao parabolóide!


O vetor gradiente V /(q ) calculado em um ponto q = (a;o,yo) é per­
pendicular à curva de nível de / que passa por q no ponto q, isto é,
ele é perpendicular à circunferência de centro na origem e raio ||q|| no
ponto q, quando q um ponto regular de / . Veja a figura abaixo.

superfície de nível de F

Moral da história: se você quer usar o gradiente para encontrar um vetor


normal (perpendicular) a uma dada figura geométrica *?, então você deve
expressar S como o conjunto de nível de uma função F e, em seguida,
calcular o gradiente de F no ponto (regular) adequado. O gradiente de
uma função / de n variáveis, cujo gráfico coincide com não fornece
um vetor normal a 5, pois o gradiente de f é um vetor de 'MF enquanto
que o gráfico de f é um subconjunto de

9.4 O caso geral do teorem a da função implícita*

O teorema da função implícita generaliza-se para funções vetoriais: dada


uma função vetorial F : D C R^*^^ R’^ de classe C \ com A; > 1, e dado um
ponto p E jD no conjunto de nível = {x E j F(x) = k = F(p)}, sob
9.4 o caso geral do teorema da função implícita* 339

uma certa hipótese que iremos estabelecer, existe uma vizinhança do ponto p
na qual o conjunto de nível j^k coincide com o gráfico de uma função vetorial
f: S C -> definida em uma bola aberta B de Vamos primeiro
ver um exemplo simples, onde F é uma transformação linear.

Exem plo 9.6 Considere a transformação linear F : definida por

F{x,y^z,r^s) = {Ax + 2y + "2.z —r + Ss, 2x + 2z + 8 r - 5 s , 2x + 2y + r —s)

e o conjunto de nível

^(5,7,0) = {(a:, y, z, r, s) € | F(a:, y, z, r, s) = (5,7,0)}.

Será que ^(5,7,0) pode ser representado como o gráfico de uma função? Um
ponto (x, ?/, r, s) pertence ao conjunto de nível ^(5,7,0) se suas coordenadas
satisfazem o sistema linear

Ax + 2y + 2z — r + 35 = 5,
2x + 2 z + 8r — 5 s = 7,
2x + 2y + r — 5 = 0.

Como temos três equações e cinco incógnitas, é razoável supormos que é


possível escrever três dessas incógnitas em função das outras duas. Por
exemplo, se quisermos escrever y, 2: e r (as variáveis dependentes) em função
de X e 5 (as variáveis independentes), então devemos resolver 0 sistema

^ 2 y + 2 z — r = 5 —4 x —35,
+ 2z + 8r = 7 - 2 X + Õ5,
^ 2y + r = —2 x + 5 .

Ou ainda, em notação matricial,

"2 2 -1 ■ ' y' ' 5-4x-3s'


0 2 8 z = 7 — 2x + 5 s
2 0 1 r —2 x + s
A

Como a matriz A é inversível, com inversa dada por


340 O teorema da função implícita

-1
■2 2 -1 ■ 11 1 -1 9‘
0 2 8 8 2 -8
_2 0 1_ -2 2 2_

segue-se que podemos calcular z e r em função de x e s:

’y ~ 1 -1 9■ 5 —4x —3 s —2 —20 X + s
1 1
z 8 2 -8 7 —2x + 5 s 5 4 -2 0 x -lls
r _-2 2 2 —2 x + s_ 4 + 18s

Desta maneira, a função vetorial f : ^ definida por

(y, z, r) = f(x, 5) = 1/20 (-2 - 20 X + 5,54 - 20 X - 115,4 + 18 5)

é tal que o gráfico de f coincide com 0 conjunto de nível •^(5,7,0) • Nem toda
escolha de variáveis independentes é permitida. Por exemplo, se queremos
escrever x, j/ e z (as variáveis dependentes) em função de r e 5 (as variáveis
independentes), então devemos resolver o sistema

■4 2 2■ 'y' 5+ r —35
2 0 2 z = 7 —8r + 5 s
2 2 0 r _0 — r + s _
B

Como B não é uma matriz inversível (pois det{B) = 0), podem existir valores
de r e 5 para os quais o sistema acima não possui solução. De fato, para
r = —5 e 5 = 0, o sistema

■4 2 2' ' y' 0‘


2 0 2 .
z _ 47
_2 2 0_ -^- 5,

não possui solução. Logo, não é possível escrever 0 conjunto de nível ^(5,7,0)
de F como 0 gráfico de uma função vetorial f que depende de r e 5. ^

Considere agora uma função vetorial F : R^ — R^ não-linear definida por

F(x, y, z, r, s) = {Fi{x, y, z, r, s), Í2(x, y, z, r, s), Fs{x, y, z, r, s))


9.4 o caso geral do teorema da função implícita* 341

de classe com A: > 1, um ponto p* = e o conjunto de


nível

•^k = {(a:, y, z, r, s) e # | F (x, y, z,r,s) = k = F{x% y*, z*, r*, s*)}

de F que passa por p*. Será que pode ser representado como o gráfico
de uma função em uma vizinhança de p*? Para tentar responder a esta per­
gunta, vamos olhar para um objeto mais fácil de se trabalhar: a aproximação
linear de F no ponto p* dada por

l(x) = F(p*) + D F ( p * ) .( x - p * ) ,

onde X = ( x , y , z , r, 5 ) e p* = ( x * , y * , 2:*, r * , 5 * ) . Ao invés de perguntar se


pode ser representado como o gráfico de uma função em uma vizinhança
de p*, vamos perguntar se o conjunto de nível

-Ck = {(a:, y, z, r, s) G | l(x) = k = l(p*)}

de 1 que passa por p* pode ser escrito como o gráfico de uma função em
uma vizinhança de p*. Se x G £k> então l(x) = k e, portanto, k = l(x) =
F(P*) + D F(p*) • (x — p*). Como F(p*) também é igual a k, segue-se que

D F ( p * ) .( x - p * ) = 0

ou, em termos de coordenadas,



~ X — X* ~

ÕF2 ÕF2, ÕF2 ÕF2 ÕF2, ,, y-y*


z — z*
r — r*
dFz dFz dFs õFs dF^
_ s — s* _
' H'”' ãl'”>IF'”>
Esta equação matricial gera um sistema linear com três equações e cinco
variáveis:

^ (P -) . (X - X -) + ^ ( p - ) . { y - y -) + ^ ( p - ) . (X - x -)+

^F^ õFi
^ ( p * ) - ( r - r ‘) + ^ ( p * ) - ( 5 - O = 0,
342 O teorem a da função im plícita

^ ( p * ) . (x - X-) + ^ ( p 1 ■(» - ü") + ^ ( p ‘) ■ - ^‘)+

^ ( P ‘) ■( ' - <■') + ^ ( P ”) ■(» - s‘) =

^ ( P - ) . (X - X-) + ^ ( p - ) . (!, - »•) + ^ ( p > ) . (z - .• )+

^ ( p . ) . ( r - r - ) + ^ ( p . ) . ( ^ _ , - ) = 0.

Desta maneira, se quisermos saber se o conjunto de nível £k de 1 pode ser


escrito como o gráfico de uma função vetorial, devemos estudar o sistema
linear acima da mesma maneira que fizemos no exemplo (9.6) anterior. As­
sim, por exemplo, se queremos escrever z e r como uma função de x e 5,
então o sistema
dFi dFi dFi

dF2f dF2f
,s dF2f,s
y-y
z — z*
ã^<P > s7(P > 17<P )
d F% d d Fri

§ ( p - ) . ( x - x - ) + f ( p ' ) . (» -> •)

§ ( p - ) . ( x - x - ) + f ( p ' ) . ( * - .• )

deve possuir uma única solução para cada valor de x e 5. A fim de que isto
aconteça, é suficiente que a matriz
dFi
(p ) ã 7 ( p )
SFi, dF2 dFo
(P*) ^ (P * )
^■^3/ *x m
dz dr
seja inversível. E, como era de se esperar, esta condição também é suficiente
9.4 o caso geral do teorema da função implícita* 343

para que o conjunto de nível .Fk de F possa ser escrito como o gráfico de
uma função vetorial [y, z, r) = f(x, y) em uma vizinhança do ponto p*.

O próximo teorema, a forma mais geral do teorema da função implícita,


generaliza estas conclusões para funções vetoriais de R’"'*’" para M".

T eo rem a 9 .6 ( 0 t e o r e m a b a p u n ç ã o i m p l í c i t a ) doasídere agora


uma função vetorial F • —>■ definida p o f ■> ‘

I í ’( x ,y ) = (F |(x ,y ) ,F 2 ( x ,y ),...',^ i4 (x ,y ) ) ' -

de classe C* com fe > 1, um ponto p* = (x*,y*j e O,conjunto de nível

' = { ( x ,y ) € R -+ « I F { x ,y ) - k = F (x ^ y * )} j-

de F que passa por p*. Aqui x ^ {xi,. y = { yi , . . , y^),

dF
’i dFr
(P^) iP*)
dVi 'tn
DyF(p*) = lllll! ;
dFm
(P*)
- %i dVm ^ ^
■ é inversível^ então existe uma. função vetorial ,fi ,J3 C K” -í- de
classe (7* definida em um aÜoia aberta B de tiàl que

(b) F(x*, f(x*)) = k para todo x € B ,

(d) a matriz jacobiana de f rip ponto x* pode sér calculada em termos


da matriz jacobiana de F no ponto p* = (x*> y*):

I ? f( x * ) = { Í ) y F { p * ) )- '* I ? ,P ( p d .- ! ; -

Nesta situação, dizemos que a equação F ( x ,y ) = k define implici­


tamente y como uma função vetorial f de x em uma vizinhança do
ponto p* = (x*,y*) = (a:í, . . . , y t , . . . , y l ) ...............
344 O teorema da função implícita

No teorema da função implícita, em analogia à notação DyF(p*), o símbolo


Z?xF(p*) significa

■1^'
UXfi (P*)
i^xF(p*) =
dFjn
dXn (P*)

9.5 Exercícios

[01] Seja F : definida por 2 = F{x, y) = x'^ — xy^ + y^.


(a) Mostre que 0 ponto p = (5,2) pertence à curva de nível
•^17 = {(a^,í/) e I F{x,y) = 17}
de F associada ao nível 2; = 17.
(b) Use o teorema da função implícita para demonstrar que existe uma
função / : / C M ^ M definida em um intervalo / aberto contendo
X = 5 tal que /(5) = 2 e F{x, f{x)) = 17 para todo x e L
(c) Use o teorema da função implícita para calcular f{5).
(d) Encontre a equação da reta tangente ao gráfico de / no ponto (5, 2).
[02] Seja F : —)►M definida por 2^ = F(x, y) = [y — x ^ .
(a) Faça um esboço das curvas de nível de F associadas aos níveis 2; = 0,
2: = 1 e 2; = 16.
(b) Faça um esboço do gráfico de F.
(c) Mostre que p = (0,0) pertence à curva de nível
•^0 = {{x,y) G I F{x,y) = 0}
de F associada ao nível 2: = 0.
(d) Mostre que Fa;(0,0) = 0 e Fy{0,0) = 0.
(e) Mostre que a curva de nível F q pode ser representada como 0 gráfico
de uma função y = f{x), com x G M.
(f) Este exercício constitui um contra-exemplo para o teorema da fun­
ção implícita para R^? Justifique cuidadosamente sua resposta.
9.5 Exercícios 345

[03] (a) Use o teorema da função implícita para demonstrar que a equação
—X —y + l = 0 define y como uma função / de x em uma
vizinhança do ponto p = (1,1).
(b) Use o teorema da função implícita para calcular f { l ) .
[04] Seja F : R ^ definida por z = F(x, y) = x - y.
(a) Mostre que o ponto p = (1,1) pertence à curva de nível
•^1 = {(a:, 2/) G I F{x,y) = 1}
de F associada ao nível z = 1.
(b) Mostre que p = (1,1) é um ponto regular da função F.
(c) Encontre a equação da reta tangente r a curva de nível no ponto
P = (1, !)•
(d) Faça um esboço do desenho de r e V F (1 ,1).
[05] (a) Mostre que p = (4,3) é um ponto regular da função G: -> R
definida por z = G{x,y) = x'^ — Sxy + — 7.
(b) Encontre a equação da reta tangente à curva de nível
;^ o -{ (x ,2 / ) e R 2 |G (x ,y ) = 0}
de G associada ao nível z = 0 no ponto p = (4,3).
[06] Seja / ; R —>■R uma função de classe C°° tal que
-/(x)
. , 16
u du = — , para todo x G
/
com / ( —2) = 2. Calcule / ' ( —2).

[07] Enuncie cuidadosamente o teorema da função implícita para R^.

[08] Considere a função z = F(xi, X2, y) = x^ —X2 + y^.


(a) Se (xi, X2) = (6, 3), encontre um y que F(xi, X2, y) = 0.
(b) A equação F ( xi ,X2, í/) = 0 define y como uma função implícita de
(xi, X2) em uma vizinhança do ponto (6, 3, j/), com y sendo o valor
que você escolheu no item (a)?
(c) Em caso afirmativo, encontre {dy/dxi){6^3)j (9j//5x2)(6,3) e a
equação do plano tangente ao gráfico de j/(xi,X2) no ponto (6,3).
346 O teorema da função implícita

[09] (a) Use 0 teorema da função implícita para demonstrar que a equação
+ 3 2/^ + 8 — —^
define 2: como uma função f de x e y em uma vizinhança do ponto
p = (1,0,1).
(b) Use o teorema da função implícita para calcular as derivadas parci­
ais /a;(l,0) e fy{l,0) de / .
(c) Encontre a equação do plano tangente ao gráfico de / no ponto
p = (1,0,1).
[10] (a) Use o teorema da função implícita para demonstrar que a equação
+ y^ + z^'f = + y‘^ - + IQ
define 2 como uma função f de x e y em uma vizinhança do ponto
p = (1 ,-1 ,1 ).
(b) Use o teorema da função implícita para calcular as derivadas parci­
ais /x (l, -1 ) e fy{l, -1 ) de / .
(c) Encontre a equação do plano tangente ao gráfico de / no ponto
p=(l,-l,l).
[11] Uma firma usa x horas de trabalho não-qualificado e y horas de trabalho
qualificado diariamente para produzir z = y) = 4 unidades
de um certo produto por dia. Desta maneira, com xq = 10000 horas
de trabalho não-qualificado e yo = 625 horas de trabalho qualificado,
esta firma produz 20000 unidades do produto por dia. Use a equação
da reta tangente à curva de nível

<^ = {(a;,í/) e I Q{x,y) = = 20000}

de Q associada ao nível z = 20000 no ponto p = ( x q , yo) = (10000,625)


para obter uma aproximação da quantidade de trabalho qualificado ne­
cessária para manter a mesma produção diária de 20000 unidades do
produto, sabendo que a firma pretende contratar uma hora adicional de
trabalho não-qualificado.
[12] Seja / : R uma função de classe C \ com A; > 1. Mostre que 0
vetor

é perpendicular ao gráfico da função / no ponto {x*, y*, f{x*, y*)).


9.5 Exercícios 347

*[13] Seja / : W uma função de classe com A; > 1. Mostre que o


vetor

V =

é perpendicular ao gráfico da função / no ponto (p*, /(p*)), onde p* =

[14] Seja w = /(x , y, z) = + x^z + + z^/2 + xy.


(a) Calcule a equação do plano tangente à superfície de nível
{{x,y,z) € I f { x , y , z ) = 17}
da / associada ao nível ií; = 17 no ponto p = (1,3,2).
(b) Calcule a equação do hiperplano tangente ao gráfico de / no ponto
q = ( p , / ( p ) ) = (l,3,2,17).
[15] Considere a função z = f{x^y) = + 2 xy^ + 2 + 1.
(a) (d) Calcule a equação da reta tangente à curva de nível de / que
passa pelo ponto p = (1,1).
(b) (d) Calcule a equação do plano tangente ao gráfico de / no ponto
q = (p,/(p)) = (1,1,6).
[16] (Elipsóide) Considere a função

j., s 2^
u; = /(x, y, 2) = ^ + ^ + ^ ,

onde a, b e c são constantes positivas. Como vimos, o elipsóide é a


superfície de nível de / associada ao nível w = 1:

íFi = |(a:,2/. z) e

(a) Mostre que todos os pontos p = do elipsóide são


pontos regulares de / .
(b) Se a = 2, 6 = 3 e c = 4, encontre a equação do plano tangente ao
elipsóide no ponto p = (2 \/3/3, 3 \/3 /3 ,4 \/3/3) do elipsóide ÍF\.
(c) Encontre a equação do plano tangente ao elipsóide em um ponto
p = (x*, y*, z*) do elipsóide
348 O teorema da função implícita

[17] Seja w = F[x^y^ z) uma função de classe tal que F (l, 2, 3) = 10 e


V F(1,2,3) = (4,5,6).
(a) Mostre que a equação F{x^y^z) = 10 define como uma função
implícita / de (x,y) em uma vizinhança de (1,2), y como uma
função implícita g áe {x^ z) em uma vizinhança de (1, 3) e x como
uma função implícita /i de (y, z) em uma vizinhança de (2, 3).
(b) Mostre que

* [18] Enuncie cuidadosamente o teorema da função implícita para o conjunto


de nível de uma função vetorial F : —>■ .
* [19] Enuncie cuidadosamente o teorema da função implícita para o conjunto
de nível de uma função vetorial F : R"+^ —)• R".
* [20] Seja F ; R^ —>• R^ definida por F(x, y, z, v) = (xz^ + xz + yvz^).
(a) Mostre que o ponto p = (1,1,1,1) pertence ao conjunto de nível
^(2,2) = {(a:, y, z, v) e R"^ 1F(x, y, z, v) = (2,2)}
de F associada ao nível k = (2, 2).
(b) Use o teorema da função implícita para demonstrar que existe uma
função f: B C definida em uma bola aberta B contendo
{ x \ y*) = (1,1) tal que f(l, 1) = (1,1) e F(x, y, f(x, y)) = (2, 2) para
todo (x, y) 6 B.
(c) Use o teorema da função implícita para calcular a matriz jacobiana
D f(l, 1) de f no ponto (x*, j/*) = (1,1).
* [21] A economia de um certo país está em equilíbrio se o sistema de equações

2 x z + xy + z — 2 ^/z — 11 xyz — 6

é satisfeito. Uma solução para este sistema é dada por x = 3, y = 2


e z = 1. Suponha que o primeiro ministro deste país descubra que a
variável >2: (a produção de pele sintética de castor) possa ser controlada
por decreto.
(a) Se o primeiro ministro aumenta 2; de 1 para 1.1, use o teorema da
função implícita para estimar os novos valores de x e y, a fim de se
manter 0 equilíbrio da economia.
9.6 Leitura suplementar 349

(b) Se apenas a variável x estivesse sob controle do primeiro ministro,


explique porque o teorema da função implícita não pode ser apli­
cado, a fim de se estimar o efeito de uma redução no valor de íc de 3
para 2.5, nos novos valores de ?/ e z, a fim se manter o equilíbrio da
economia.
* [22] A produção de uma determinada empresa é modelada com a função de
produção Cobb-Douglas 2: = f { x ^ y ) = com a == 0.5 e 6 = 0.5,
onde X e y são as quantidades de duas matérias-primas necessárias para
a produção. Com os valores x = 25 e y = 100, a empresa produz 2: = 50
unidades. O dono da empresa pretende adquirir uma nova tecnologia
para a qual o expoente b na função de produção mudará de 0.5 para
0.504, sem nenhuma alteração no valor do expoente a. Use o teorema
da função implícita para estimar a combinação de matérias-primas que
manterá a produção 2; da empresa e a soma x + y das quantidades x e
y das duas matérias-primas constantes.

9.6 Leitura suplem entar

Você pode encontrar a demonstração do teorema da função implícita nas


referências [01, 71]. A referência [71] traz algumas aplicações: estatística
comparativa e o paradoxo de Simpson. Na área de Engenharia, o artigo

G. Nord, D. Jabon e J. Nord, The Global Positioning System and The


Implicü Function Theorem^ SIAM Review, vol. 40, no. 3, pp. 692-696,
1998.

apresenta uma interessante aplicação do teorema da função implícita no sis­


tema GPS.
Capítulo 10

Máximos e mínimos de funções de


várias variáveis

A partir deste capítulo, vamos desenvolver ferramentas de cálculo dife­


rencial necessárias para resolver problemas de otimização.

10.1 D efinições e exem plos

D efinição 10.1 ( M jÍ x i m o s e m ín im o s ) Considere unia função de n

/■ D / C -> E ' •
definida era Df e D um subconjunto de D /. ,
(a) Dizemos que p € D é um; ponío de mánmo glàbal de / em D èè

para todo x € D. Neste caso, o número real /( p ) é denoiiiinàcío o


valor máximo de / . *
(b) Dizemos que p € D é um ponto de mínimo global de / em D se

para todo x € D. Neste caso, o número real /( p ) é denominado o


valor mtmmo de /
352 Máximos e mínimos de funções de várias veiriáveis

(c) Dizemos que p € D é um ponto de máximo local de / em D se


existe uma bola aberta Sr(p) de centro em p e raio r > 0 tal que

liillililMiliilliiilM
para todo x € Br(p) H D.
(d) Dizemos que p € D é um ponto de mtmmo local de / em D se
existe uma bola aberta Br(p) de centro em p e raio r > 0 tal que

m >m

para todo x G J5r(p) H D

(e) Dizemos que p G D é um eqdremo global de / em D se p é mn


ponto de máximo global ou um ponto de mínimo global de / em D.
({) Dizemos que p G D é um extremo local de / em D se p é um ponto
de máximo local ou um ponto de mínimo local de / em D.

A função / é denominada função-objetivo e o conjunto D de conjunto


admissível do problema de otimização.

Preqüentemente, o conjunto admissível D é definido com o uso de funções.


Assim, se h: Dh C R" -í- K™ e g: Dg C M" ->• então

D = {x G Dh n Dg I h(x) = 0 e g(x) < 0}.

A notação g(x) < 0 significa que ^i(x) < 0, 52(x) < 0, . . . , gk^x) < 0, onde
5i) 52) ••• 1 gk são as funções coordenadas de g.
No problema (1.1) (0 problema da caixa), 0 conjunto admíssivel

D = {x G R I 0 < r < 15}

é definido com 0 auxílio da função g[x) = x, enquanto que o conjunto ad­


missível do problema (1.2) (0 problema da dieta) é definido com o auxílio de
treze funções de R® para R (veja as desigualdades da página 29).
Observe a diferença entre um extremo local e um extremo global de uma
função-objetivo / em um conjunto admissível D, segundo a definição (10.1).
10.1 Definições e exemplos 353

Para um extremo global, comparamos o valor da função / no candidato a


extremo global p com todos os pontos do conjunto admissível^ enquanto que,
para um extremo local, comparamos o valor da função / no candidato a
extremo local p com todos os pontos do conjunto admissível em uma bola
aberta de centro em p.
Na figura (10.1) temos o gráfico de uma função / de duas variáveis de
classe definida no conjunto admissível D = [—3,+3] x [—3,+3] (um
quadrado no plano cartesiano). O ponto p é o ponto de mínimo global de /
em 0 ponto q é o ponto de máximo global de / em D e os pontos r, s, t
e u são pontos de máximo local de / em D.

O fato de / possuir ou não extremos (sejam eles locais ou globais) de­


pende evidentemente da expressão de / , mas depende também do conjunto
admissível D. Por exemplo, a função

2 == f{x ,y) = x^ + 3/^

possui um único ponto de mínimo global em

A =R2

(o ponto (0, 0)) e ela não possui ponto de máximo global em D\. Por outro
lado, esta mesma função-objetivo possui pontos de máximo e mínimo global
no conjunto admissível

Ü 2 = {(x, y) G I g{x, y) = x^/A + < !}•

O ponto 0 = (0, 0) é 0 ponto de mínimo global de f em D 2 e os pontos


p = (0 ,-3 ) e q = (0,+3) são os pontos de máximo global de / em D 2,
conforme a figura (10.2). Finalmente, no conjunto admissível

Ds = {(x, 2/) G R^ I g{x, y) = x^^/A + y^/^ = 1},

f possui dois pontos de mínimo global, r = (—2,0) e s = (-f2,0), e dois


pontos de máximo global, p = (0, —3) e q = (0, +3), conforme a figura (10.3).
Como todo extremo global também é um extremo local (por que?), estes
exemplos mostram que uma função pode possuir extremos locais na fronteira
do conjunto admissível.
354 Máximos e mínimos de funções de várias variáveis

Figura 10.1: O gráfico de um a função de duas variáveis no quadrado D = [-3 , +3] x [-3 , +3].
10.1 Definições e exemplos 355

Figura 10.2: O gráfico de z = /(rr,y ) = no conjunto admissível


D l - {(x, J/) e I g{x, y) - x^/4 + í/^/9 < 1}.
356 Máximos e mínimos de funções de várias variáveis

Figura 10.3: O gráfico de z = = + j/^ no conjunto admissível


Di = {(i, í/) 6 I g{x, y) = x^/4 + 2/^/9 = 1}.
10.2 Exercícios 357

Finalmente, relembramos um dos poucos teoremas que estabelece, a pri-


orij a existência de máximos e mínimos globais: o teorema de Weierstrass.
Este teorema afirma que toda função contínua definida em um conjunto ad­
missível D compacto e não-vazio possui pelo menos um ponto de máximo
global e pelo menos um ponto de mínimo global em D.
N o ta histórica. Em matemática, o estudo de problemas de máximo e
mínimo começou há muito tempo atrás, de fato, há 25 séculos atrás. Por um
longo período, não se descobriu uma maneira uniforme de se atacar proble­
mas de otimização. Os primeiros métodos de caráter geral foram criados há
300 anos atrás, na época em que a análise matemática nascia. Ficou claro
então que certos problemas de otimização especiais desempenham um papel
fundamental em ciências naturais. Mais especificamente, descobriu-se que
muitas leis naturais podem ser obtidas a partir de certos “princípios varia-
cionais” . Em 1744, o cientista francês Pierre Louis Moreau de Maupertius
propôs 0 seu “princípio metafísico”: a natureza sempre opera com a maior
economia possível. Dentre uma coleção de movimentos admissíveis, o movi­
mento de um sistema mecânico, ou da luz, da eletricidade, de um fluido ou
de um gás é escolhido de forma que certas quantidades sejam maximizadas
ou minimizadas. A necessidade de se resolver estes problemas, como muitos
outros problemas em geometria, mecânica e física, levaram à criação de uma
nova área em análise matemática, o cálculo das variações.

10.2 Exercícios

[01] A figura (10.4) mostra o gráfico de uma função que aproxima a altura
(em km), com relação ao nível do mar, de uma região do Havaí, formada
pelo retângulo entre as longitudes 195° e 210° e entre as latitudes 18° e
25°. Marque no mapa de contorno alguns pontos de máximo e mínimo
local dessa função.
[02] Mostre que (0, 0) é um ponto de mínimo global da função

2; = f{x, y) = x^ +
estudada 0 exemplo (3.1).
[03] Mostre que (0, 0) não é nem um ponto de máximo global e nem um
ponto de mínimo global da função 2: = f{x ,y ) = x ‘^ — estudada no
exemplo (3.2).
358 Máximos e mínimos de funções de várias variáveis

Figura 10.4: Gráfico e mapa de contorno de função que aproxima a altuta


com relação ao nível do mar de uma região do Havaí.
10.2 Exercícios 359

[04] Mostre que a função z = f{x, y) = In —1), estudada no exercício


resolvido (3.1), não possui extremos globais.
[05] Encontre os extremos globais (caso existam) da função

w = f{x, y, z) = \/9 — —2:^

estudada no exemplo (3.3).


[06] Mostre que a função w = f{x, y, z) = z — x"^ — y^, estudada no exem­
plo (3.4), não possui extremos globais.
[07] Mostre que o teorema de Weierstrass não é mais válido se removermos
a hipótese de continuidade ou de compacidade do domínio da função /
exibindo:
(a) Uma função descontínua definida em um subconjunto K compacto
em que não possui nem máximo global e nem mínimo global
em K.
(b) Uma função contínua definida em um subconjunto F fechado mas
não-limitado (e, portanto, não-compacto), em E^ que não possui
nem máximo global e nem mínimo global em F.
(c) Uma função contínua definida em um subconjunto L limitado mas
não-fechado (e, portanto, não-compacto) em E^ que não possui nem
máximo global e nem mínimo global em L.
[08] Use o teorema de Weierstrass para dizer se é possível garantir, a priori^
se cada um dos problemas de otimização abaixo possui ou não uma
solução.
(a) Maximizar f {x, y) = x + y
sujeito às restrições: x > 0,y > 0 e x^ + y^ < 1.
(b) Maximizar /(rc, y) = a;2 -
sujeito às restrições: x > 0 e y > 0.
(c) Minimizar f {x, y) = x - y
sujeito às restrições: x > 0 , y > 0 e x + y = l.
(d) Maximizar f {x, y) = sen(x2 + y^)
sujeito à restrição: + y^ < 1.
(e) Maximizar /(x , y) = sen(x^ + y^)
sujeito à restrição: x^ + y^ < 1.
360 Máximos e mínimos de funções de várias variáveis

(f) Maximizar f{x, y) = sen{x^ + y^)


sujeito à restrição: + y"^ = 1.
(g) Maximizar /(x , y,z) = x + 2y + Zz
sujeito às restrições: x > 0 , y > 0 , z > 0 e x + t/ + z < l .
(h) Maximizar /(a;, y,z) = x + 2y + Zz
sujeito às restrições: x > 0, y > 0 e z <
(i) Maximizar /(x ,y , z) = x + 2 y + 3z
sujeito às restrições: x > 0 , y > 0 , z > 0 , x < l , y < l e z < l .
[09] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Toda função f \ W ^ M de classe possui pelo menos um ex­
tremo local em W .
(b) Toda função f i W ^ R d e classe limitada (isto é, uma função
para a qual existem constantes L e M tais que L < f{x) < M para
todo X E M”) possui pelo menos um extremo local em W.
(c) Todo extremo local de uma função / em um conjunto admissível D
também é um extremo global de / em D.
(d) Todo extremo global de uma função / em um conjunto admissível D
também é um extremo local de / em D.
(e) Se f possui um máximo global em um conjunto admissível D, então
/ também possui um mínimo global em D,
(f) Se f possui um mínimo global em um conjunto admissível D, então
/ também possui um máximo global em D.
(g) Se / possui um mínimo local em um conjunto admissível D, então
/ também possui um mínimo global em D.
(h) A função constante / : -> R definida por y = f{pc) = k não
possui extremos globais em R’^.
(i) Uma função / não pode possuir uma quantidade infinita de extre­
mos globais em um conjunto admissível D.
(j ) Uma função / não pode possuir uma quantidade infinita de extre­
mos globais em um conjunto admissível D limitado.
(k) Uma função / não pode possuir uma quantidade infinita de extre­
mos globais em um conjunto admissível D compacto.
10.2 Exercícios 361

[10] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Se p é um ponto de mínimo global de / em um conjunto ad­


missível D, então p é um ponto de máximo global de —/ em D.
(b) Se p é um ponto de máximo global de / em um conjunto ad­
missível D, então p é um ponto de mínimo global de —f em D.

[11] Sejam / : D C -> R uma função tal que /(x ) > 0 para todo x G D
e /i: D C R^ R definida por /^(x) = ^ / ( x ) .

(a) Mostre que p G D é mínimo global de / em D se, e somente se,


p G D é mínimo global de h em D.
(b) Mostre que p G D é máximo global de / em D se, e somente se,
p G D é máximo global de h em D.

[12] Sejam f : D C R uma função tal que /(x ) > 0 para todo x G D
e /i: jD C R^ H definida por /i(x) = ln (/(x )).

(a) Mostre que p G D é mínimo global de / em D se, e somente se,


p G D é mínimo global de h em D.
(b) Mostre que p G D é máximo global de f em D se, e somente se,
p G D é máximo global de h em D.

[13] Sejam / : Z ? C R ^ —) * R e ^ : / C R - > R funções tais que f{D) C I e g


é crescente em I. Considere h = g o f.

(a) Mostre que p G í? é mínimo global de / em D se, e somente se,


p G D é mínimo global de h em D.
(b) Mostre que p G D é máximo global de / em D se, e somente se,
p G D é máximo global de h em D.

[14] Sejam f : D C W ' e g: I C R funções tais que f{D) C I e g


é decrescente em I. Considere h 9 ° f-
(a) Mostre que p £ D é mínimo global de / em D se, e somente se,
p G D é máximo global de h em D.
(b) Mostre que p G D é máximo global de / em D se, e somente se,
p G D é mínimo global de h em D.
362 Máximos e mínimos de funções de várias variáveis

[15] Sejam / definida por h{x) = /( x —p).

(a) Mostre que p G R’^ é um ponto de máximo global de / em R’^ se, e


somente se, 0 é um ponto de máximo global de h em W .
(b) Mostre que p 6 R^ é um ponto de mínimo global de / em R’^ se, e
somente se, 0 é um ponto de mínimo global de h em R^.
(c) Mostre que p G R’^é um ponto de máximo local de / em R’^ se, e
somente se, 0 é um ponto de máximo local de h em R^.
(d) Mostre que p G R^ é um ponto de mínimo local de / em R^ se, e
somente se, 0 é um ponto de mínimo local de h em W .

[16] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Sejam f : D f C R eD C Df. Se existem pontos p, e Q2


em D, tais que

/(q i) > /(p ) e /(qa) < /(p ),


então p não é extremo global de / em D.
Em outras palavras, se encontrarmos dois pontos e q2 em D, tais
que os valores de / nestes pontos sejam, respectivamente, maior e
menor do que o valor de / no ponto p, então p não pode ser um
extremo global de / em D.

(b) Sejam f : D f C e D C Df. Se existem pontos p, qj e q 2


em D tais que

/(Q i) > /(P) e /(q2) < /(p ),


então p não é extremo local de f em D.
Em outras palavras, se encontrarmos dois pontos e q2 em D tais
que os valores de / nestes pontos sejam, respectivamente, maior e
menor do que o valor de / no ponto p, então p não pode ser um
extremo local de / em D.

[17] Mostre que p = (0,0) não é extremo local da função z = /(x , y) =


em R^.
10.2 Exercícios 363

[18] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se p é um ponto de mínimo global de / em um conjunto ad-
missível D, i2 é um subconjunto de í) e p € ií, então p é um
ponto de mínimo global de / em R.
(b) Se p é um ponto de máximo global de / em um conjunto ad-
missível Dj R é um subconjunto de D e p G i?, então p é um
ponto de máximo global de / em R.
(c) Se p é um ponto de mínimo global de / em um subconjunto R de
um admissível D, então p é um ponto de mínimo global de f em D.
(d) Se p é um ponto de máximo global de / em um subconjunto R de
um admissível Z), então p é um ponto de máximo global de / em D.
[19] Diga se cada uma das sentenças a seguir é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Sejam / : g{x) = /(x ,0 ) (a restrição de / sobre o eixo
e h{y) = /(0 ,y ) (a restrição de / sobre o eixo y). Se x = 0 é um
mínimo local de g e y = 0 é um mínimo local de /i, então (0, 0) é um
mínimo local de / em .
(b) Sejam f : R e g{t) = f [tv) (a restrição de / sobre a reta que
passa pela origem (0, 0) com vetor diretor v). Se t = 0 é um mínimo
local de para todo v G R^, então (0, 0) é um mínimo local de /
em R^.
(c) Sejam / : R^ -> R, g[x) = f{Xj 0) (a restrição de / sobre o eixo x)
e h{y) = /(0 ,y ) (a restrição de / sobre o eixo y). Se x = 0 é um
mínimo global de g e y = 0 é um mínimo global de /i, então (0, 0) é
um mínimo global de / em R^.
(d) Sejam / : R^ ^ R e g{t) = f { t v ) (a restrição de / sobre a reta que
passa pela origem (0, 0) com vetor diretor v). Se t — 0 é um mínimo
global de p, para todo v G R^, então (0, 0) é um mínimo global de /
em R^.
Capítulo 11

Otimização sem restrições

Neste capítulo vamos desenvolver técnicas que permitam encontrar ex­


tremos de uma função escalar / que estejam no interior do conjunto ad­
missível D,

11.1 Pontos críticos e a regra de Fermat

Em Cálculo I, um extremo local p de uma função / : / C M —> M derivável,


que também é um ponto interior de /, necessariamente é um ponto crítico
de / , isto é, a derivada de / em p é zero: f \ p ) = 0. Este teorema é conhecido
como a regra de Fermat e ele se generaliza facilmente para funções escalares
de várias variáveis.

T eo rem a 1 1 . 1 (A regra d e F erm at ) Sejam f i D f C W - í R


uma função de classe definida em um subconjunto Df á e W e D C
Df . Se p G D é um extremo local de / em D e p é um ponto tnterior
dè í>, então p é um ponto crítico de f , isto a matriz jacobiana de /
em p é a matriz nula,

df,, df . .
D m (P) = [ 0 0 •. • 0 ]
dXn J Ixn
ou, em notação vetorial.

«/ È L ( p ) ^ { 0, 0, . . . , 0) ,
v /(p ) = (

isto é, 0 vetor gradiente de / em p é o vetor nulo.


366 Otimização sem restrições

Demonstração: Seja p e D um extremo local de / em D. Como p é um


ponto interior de D, isto significa que podemos caminhar localmente em
todas as direções a partir do ponto p sem sairmos do conjunto admissível D.
Mais precisamente, dado um vetor v qualquer em W , o ponto p + t • v
pertence a D para todo t suficientemente pequeno.
Assim se, por absurdo, o gradiente V /( p ) de / em p não é o vetor
nulo, caminhando-se localmente a partir do ponto p na direção do vetor
V = V /( p ) , estaremos dentro do conjunto admissível D eo valor da função /
aumentará pois, pelo teorema (8.2), V /( p ) (quando não-nulo) fornece a
direção de maior crescimento de / em p. Logo p não pode ser um ponto
de máximo local de / em D. Analogamente, caminhando-se localmente a
partir do ponto p na direção do vetor v = —V /( p ) , estaremos dentro do con­
junto admissível D e o valor da função / diminuirá pois, pelo teorema (8.2),
—V /( p ) (quando não-nulo) fornece a direção de maior decrescimento de /
em p. Logo p não pode ser um ponto de mínimo local de / em D. Temos
assim uma contradição com a hipótese de que p é um extremo local de /
em D. Logo, o gradiente de / em p deve ser igual a zero, isto é, p deve ser
um ponto crítico de / . b

A hipótese de que o extremo local p de / seja um ponto interior de D


é fundamental na regra de Fermat! Considere, por exemplo, a função ^ =
/(x , y) = e o conjunto admissível

D = {{x,y) e 1x ‘^fA + y‘^/9 < l}

(uma elipse ‘^cheia”). Os pontos p = (0 ,-3 ) e q = (0,+3) são pontos de


máximo global (e, portanto, pontos de máximo local) de / em í?, mas os
vetores gradientes de / nestes pontos, V /( p ) = (0, —6) e V /( q ) = (0,+6),
não se anulam! Isto não contradiz a regra de Fermat pois os pontos p e q
não são pontos interiores de D (veja a figura (11.1)). Por outro lado, o ponto
0 = (0, 0) é um ponto de mínimo global (e, portanto, um ponto de mínimo
local) de / em D que é um ponto interior de D e, de acordo com a regra de
Fermat, o vetor gradiente de / em 0 é o vetor nulo: V / ( 0) = 0 .

Exercício resolvido 11.1 Diga se cada uma das sentenças a seguir é ver­
dadeira ou falsa, apresentando uma justificativa caso ela seja verdadeira ou
um contra-exemplo caso ela seja falsa.
11.1 Pontos críticos e a regra de Fermat 367

V/(p)

V/(q)

Figura 11.1: Os pontos p = (0, —3) e q = (0,+ 3 ) sao extremos locais de /


em D = {(rr,y) £ | a:^/4 + y ‘^ /9 < 1} mas o vetor gradiente
de / em cada um destes pontos é não-nulo. Note que p e q são
pontos de fronteira de D.
368 Otimização sem restrições

(a) A função f { x , y , z ) = 3y+cos(x^+z^)-sen(a;^ — não possui extremos


globais em .
(b) A função /(x , y, z) — 3y+cos(x^ + z^)-sen(x^-z^) não possui extremos
globais no conjunto D = {(x, y, z) 6 R^ | x^ + + z^ = l}.

S olução :

(a) Verdadeira! Como D = R^ é um conjunto aberto, todo ponto de D é


ponto interior. Como todo extremo global é um extremo local, segue-se
pela regra de Fermat que um extremo global de / deve ser um ponto
crítico de / . Mas / não possui pontos críticos pois

^{x,y,z) = S ^ 0

para todo (x, y^z) E D = Logo, / não possui extremos globais.


(b) Falsa! O conjunto D é compacto pois D é a esfera de centro em (0,0,0)
e raio 1. A função / é contínua pois / é a soma, produto e composição
de funções contínuas. Pelo teorema de Weierstrass, / possui pelo menos
um mínimo global e pelo menos um máximo global em D. ^

C U ID A D O ! C U ID A D O ! C U ID A D O !

A recíproca da regra de Fermat é falsa!

A regra de Fermat afirma que todo extremo local de uma função / em um


conjunto admissível D, que é um ponto interior de D, necessariamente é
um ponto crítico de / . Contudo, a recíproca da regra de Fermat é falsa,
isto é, nem todo ponto crítico p G i? de uma função / é um extremo
local de / em D. Para um contra-exemplo, considere a função
z = f { x, y) = x^ - y ^
e 0 conjunto admissível D = W' {o gráfico de / é a sela de cavalo estudada
no exemplo (3.2)). O ponto p = (0, 0) é um ponto crítico de / pois

V /( 0 ,0 ) = (1 ^ (0 ,0 ), ^ ( 0 , 0 ) ) = ( 2 x , - 2 y = ( 0 , 0).
(i,j^)=(0,0)
11.1 Pontos críticos e a regra de Fermat 369

Por outro lado, p = (0,0) não é um extremo local de / em Para


justificar este fato, devemos mostrar que para toda bola aberta Bt.(0,0)
de centro em (0,0) e raio r > 0, o ponto (0,0) não é extremo de / em
5^.(0,0)flR^, isto é, devemos mostrar que para toda bola aberta 5^,(0, 0),
existem pontos = (xi, y\) e Q2 = (^2, ^2) em ^^.(O, 0) tais que
/(x i, yi) < / ( 0 ,0) = 0 e /(X 2, 2/2) > /(O, 0) - 0.
Para este fim, considere

Qi = yi) = (0, r/2 ) e Qa = (x2, 7/2) = (.r/2,0).


Estes dois pontos pertencem à bola ^^.(0, 0) e
f i x u Vi ) = /(O ,r/2) = - r V 4 < /(0 ,0 ) = 0
e

f { x 2, y 2) = /(r/2 ,0 ) = +rV 4 > /(0 ,0 ) = 0.


Outra maneira de se ver que (0, 0) não é extremo local de f é observar
que a função g{x) = /(x ,0 ) = (a restrição de / sobre o eixo x)
possui X = 0 como único ponto de mínimo local, de forma que (0, 0)
não pode ser um ponto de máximo local de / . Analogamente, a função
h{y) = /(O, y) = — (a restrição de / sobre o eixo y) possui y = 0 como
único ponto de máximo local, de forma que (0, 0) não pode ser um ponto
de mínimo local de f (veja a figura (11.2)).

No desenvolvimento acima, o ponto (0,0) é denominado um ponto de sela


de 2; = /(x ,y ) = —y^. Um ponto de sela é um ponto crítico da função
que não é nem máximo e nem mínimo local.
A regra de Fermat funciona como um grande filtro: entre todos os pontos
no interior de um conjunto admissível D (freqüentemente em quantidade
infinita), os candidatos a extremo local de uma função / em D são os pontos
críticos de / em D, isto é, os pontos em D que anulam o vetor gradiente
de / . Espera-se que a quantidade de pontos críticos (freqüentemente em
quantidade finita) seja consideravelmente menor do que a quantidade de
pontos interiores. Vamos ver como isto funciona com um exemplo.

Exem plo 11.1 Considere a função 2: = /(x ,y ) = x^ —y^ + 9xy e o conjunto


370 Otimização sem restrições

Figura 11.2: O ponto (0,0) é um ponto crítico de z = /( x , y) = — y'^ (a


sela de cavalo) mas (0,0) não é um extremo local de / .

admissível D = Observe que todos os pontos de D são pontos interiores.


Se / possui um extremo local em então, pela regra de Fermat, ele deve ser
um ponto crítico de f . Os pontos críticos de / são calculados resolvendo-se
a equação

V /( a : ,í/) = = (3x^ + 9 y ,-3 j/^ + 9 a;) = (0, 0),

isto é, resolvendo-se o sistema não linear


3 + 9 2/ = 0,
( 11. 1)
{ —3j/^ + 9x = 0.
Da primeira equação temos que y = —x^/3. Substituindo na segunda
equação e simplificando, obtemos a equação 27 x — = x (27 —x^) = 0,
cujas soluções são x = 0 e x = 3. Como y = —x^/3, concluímos que as
soluções do sistema (11.1) são (0, 0) e (3, —3). Logo, os pontos críticos de /
são (0, 0) e (3, —3). Certamente estes não são extremos globais de / em
(exercício!). Contudo, com a teoria que desenvolvemos até aqui, não sabemos
se eles são ou não são extremos locais de / . b
11.2 Polinómios de Taylor 371

Nem todo ponto crítico de uma função é um extremo local da função, como
mostra o exemplo da sela de cavalo. Precisamos desenvolver uma ferramenta
que nos permita “classificar” os pontos críticos de uma função / . Isto será
feito com o auxílio do polinómio de Taylor de ordem 2 de / , assunto de nossa
próxima seção.
O bservação. A regra de Fermat também é denominada condições de pri­
meira ordem para um extremo local.

11.2 Polinóm ios de Taylor

Polinóm ios de Taylor em Cálculo I

No capítulo 7 vimos que a “melhor” reta que aproxima o gráfico de uma


função / : R ^ R de classe em uma vizinhança de um ponto a é dada
pela reta tangente:

y = l[x) = /(a ) + f { a ) • {x - a).

Esta é a única reta que satisfaz l{a) = f [a) e l'[a) = f { a ) (Z e a derivada


de I coincidem com / e a derivada de / no ponto a, respectivamente) ou,
equivalentemente, é a única reta que satisfaz a condição

R(a,x) f(x) — l(x)


lim —L-L-Z = lim = q.
x-^a X — a X —a

A equação da reta tangente define o polinómio de Taylor de ordem 1 de /


no ponto a: y = pi{x) = f[a) + f \ a ) • [x — a).
Agora, podemos nos perguntar qual é a “melhor” parábola que aproxima
0 gráfico de uma função / : R — R de classe em uma vizinhança de um
ponto a. A resposta é dada pelo próximo teorema.

|||i |r ||i i ; |||Í |||B ^

de; Z? : Então existe um único pphnomio j^^ dé;;grãu: 2


condições p2(a) = (a)^ W
372 Otimização sem restrições

'' í/ = •= s {a ) + f'{a) - { x - a ) {® —
2!
M ^s ainda^ vale qiiêi

*->a [íc —a)^


istõ é, a diferença entre f { x ) e P2(aj) vai para zero mais rapidamente
do.que (a; —( i f . Em outras palavras,

f { x ) ~ f.{a) + / ( o ) • (x - a) + (« —a)^ + fí2(a, a;),


2!
com

®-4a [ x —a y
0 polinómio p2 é denominado o poUnôvno de T aylor de ordem 2 de f
no p on too/

D em onstração: Sejap 2(a;) = a+/ 3- x + 7 *a;^ um polinómio do segundo grau.


Uma vez que P2(®) = ^ + 2 • j • x e = 2 • 1 • 7 = 2! • 7 , temos

^2(0) = f"{o) =?►2! • 7 = /"(o) =í^ 7 = m


2! ■
Com o valor de 7 podemos encontrar 0 valor de ,0:

^2(0) = /'(«) =!» ^ + 2 • 7 • o = /'(o)


/3 + f " [ a ) . o = /'(o) ;0 = /( o ) - /"(o) • o.
Com os valores de e 7 podemos encontrar 0 valor de a:

P 2Í0) = /(o ) =í^a + j0 -a + 7 -o^ = /(o ) =>

a + (/'(o) - /"(o) • o) • o + /"(«) o^ = /(o )


2!

a = /(o ) - (/'(<=) - f"(a) ■a ) . a - ® .2


2!
Substituindo estes valores de a, e 7 em ^2(2:) = a + /3 • ® + 7 • temos
11.2 Polinómios de Taylor 373

P2{x) = f{a) - (/'(a) - /"(a) - a ) - a - ■

( /( a ) - /"(a) ■a) - x + -x ^
/3 7
Multiplicando-se as expressões acima e colocando-se f'{a) e f"{a)/2\ em
evidência, concluímos que

P2{x) = f{a) + f'{a) • (a; - a) + ■(x'^ - 2 ■a ■x + a'^) =

f{a) + f'{a) - { x - a ) + ■{x - a f .

Finalmente, aplicando a regra de L’Hôpital duas vezes, temos

x-^a [X — a)^ X^a 2 •[X — a)


- p>^{x) n a )-p 'i{a ) ^
x-^a 2 2 ^
isto é, o erro x) = f{x) —p 2 {x) vai para zero mais rapidamente do que
a expressão (x —a)^. ^

E xem plo 11.2 Vamos calcular os polinómios de Taylor de ordem 1 e 2 da


função exponencial f{x) = em a = 0. Como f{x) = f'{x) = f ”{x) = e^,
segue-se que /(O) = f { 0 ) = f"{0) = = 1. Assim, o polinómio de Taylor
de ordem 1 de / em a = 0 é dado por

y = pi{x) = /(O) + /'(O) • (x - 0) = 1 + 1 • (x - 0) = 1 + X

e o polinómio de Taylor de ordem 2 de / em a = 0 é dado por

y = P2{x) = /(O) + /'(O) • (x - 0) + ■{x - 0)2

= 1 + 1 • (a: - 0) + ^ • (^ “ 0)2 = 1 + X + ^ .

Podemos usar p\ e p 2 para aproximar o valor de / em pontos próximos


de a = 0. Por exemplo, pi(0.2) = 1.2 e P2(0.2) = 1.22, enquanto que
374 Otim ização sem restrições

/(0 .2) = = 1.22140__ Outro exemplo: Pi(l) = 2 e P2(l) = 2.5


enquanto que / ( l ) = = 2.718__ A figura (11.3) mostra o gráfico de / ,
P i e P2. ■

Figura 11.3: Os gráficos de f(x) = e dos polinómios de Taylor Pi(x) =


1 + X de ordem 1 e P2(^) = 1 + x + x^/2 de ordem 2 de / no
ponto a = 0.

O polinómio de Taylor de ordem 2 permite construir um classificador de


pontos críticos de uma função de uma variável. Sejam / : / C M -> R uma
função de classe e x = a um ponto crítico de / no interior do conjunto I.
Do teorema (11.2), sabemos que

f{x) = f{a) + f { a ) • (a; - a) + (x - a)^ + Ü2(a, rc).


2!
Uma vez que x = a é ponto crítico de / , isto é, uma vez que f { a ) = 0,
segue-se que

f{x) = /(a ) + • {x - a f + R 2 {a, x).

Subtraindo-se /(a ) dos dois lados desta equação e dividindo-se por {x —a)^,
o que é permitido para pontos x ^ a, obtemos que
11.2 Polinóm ios de Taylor 375

f{x) - f{a) f"{a) R 2 {a, x)


{x - ay {x — ay

Suponha que f'{a) seja maior do que zero. Uma vez que R 2 {cl, x )/ {x —.a)^
0 quando a; —> a, existe um r > 0 tal que

/" ( q) R 2 {a,x) f"{a)


0 < \x — a\ < r
4 {x — a y 4 '

Assim, para 0 < \x — a\ < r temos R 2 {a^x)/{x — a)^ > —/" (a )/4 e, con-
seqüentemente,

f{x) - f{a) ^ f"{a) ^ R 2{a, x) ^ f'{a) _ f"{a) ^ f"{a) ^ ^


{x - ay (x — ay

para todo x com 0 < \x —a\ < r. Isto mostra que para todo x diferente de a
no intervalo aberto (a —r, a + r), f{x) —f{a) > 0, isto é, f{x) > f{a). Logo,
X = a é um mínimo local de / . Suponha agora que f ”{a) seja menor do que
zero. Uma vez que R 2 {a, x)/ [x — a)^ 0 quando x -> a, existe um r > 0
tal que

f"{a) R2{a, x) /"(g)


0 < \x — a\ < r
4 {x — a y 4 '

Assim, para 0 < |a; —a| < r temos R 2 {a,x)/{x — a)^ < —/" (a )/4 e, con-
seqüentemente,

/(x ) - / ( g ) _ /"(g) R 2Ía,x) f { a ) _ f"{a) ^ f"{a)


(x - g)2 2 ^ (x - g)2 ^ 2 4 4

para todo x com 0 < \x — a\ < r. Isto mostra que para todo x diferente
de a no intervalo aberto (a —r, a + r), f{x) — f{a) < 0, isto é, f{x) < f{a).
Logo, X = a é um máximo local de / . Estes dois resultados constituem as
condições de segunda ordem de um extremo local de uma função de uma
variável de classe C^.

T eorem a 11.3 (C ondições de segunda ordem ) Considere uma


função / “ Z) C K —^ S de classe e X = a um ponto crítico de / no
interior do conjunto admissível D
376 Otimização sem restrições

(á) Sè /"(a) > 0, então x = a é um ponto de mínimo local de /


(b) Se /"(o) < 0, então x = a é um ponto de máximo local de f .
|c ) Se f"{à) — 0, então x = a pode ser um ponto de mímmo local, um
ponto de máximo local ou um ponto de sela de / .

O item (c) do teorema acima diz que se a é um ponto crítico de f e f"{a) =


0, então as condições de segunda ordem não conseguem classificar o ponto
crítico a. Para ver isto, considere as funções f{x) = g(x) = —x"^ e
h{x) = X®. O ponto o = 0 é ponto crítico das três funções e as derivadas de
segunda ordem de f , g e h se anulam neste ponto (nesta situação, dizemos
que o é um ponto crítico degenerado de /) . Mas a = 0 é um ponto de mínimo
local de / , um ponto de máximo local de 5 e um ponto de sela de h. Veja a
figura (11.4).
Evidentemente, podemos considerar polinómios de Taylor de ordem maior
do que 2.

Teorem a 11.4 (O polinómio db Taylor db ordem k) Considere


uma função / . í? C M -> M de classe e d um ponto do interior
de D . Então existe um único polinómio ph de grau k que satisfaz as
condições pk{a) = /(a ), p'f.{a) = /'(n ), . . , p f \ a ) = f ^ \a ) :

r (g )
y = Pk{x) = /(a )+ /'(a )-(x -a )- {x-af+- (x —a)*'.
2! ib!
Mais ainda, vale que

Um/ W - w W , 0 ,
—oj*
isto é, a diferença entre /(x ) e pk(x) vai para zero mais rapidamente
d|> que (x - a)*'. Em outras palavras, ■

. f i x ) =Pk { x ) ^ - Rk { a , x )
com

, [ar ü)^ (ar —a}^


11.2 Polinómios de Taylor 377

Figura 11.4: Os gráficos de f{ x ) = g{x) = - x ^ e h{x) = x^. Observe que


/'(O ) = 5'(0) = /i'(0) = 0 e /"(O) = s"(0) = h"{0) = 0.
378 Otimização sem restrições

krãe:i
fflilH iili:®

P o lin ó m io s d e T aylor em C álcu lo II

No capítulo 7 vimos que o “melhor” plano que aproxima o gráfico de uma


função / : -> R de classe em uma vizinhança de um ponto p é dado
pelo plano tangente:

2 l(x, y) = f{a, b) + |^ ( a , 6) • (a; - a) + |^ ( a , b ) - { y - b ) .

Este é 0 único plano (polinómio de grau um em duas variáveis) que satisfaz


as condições l{a, b) — /(a , 6), {dl/dx){a, b) = {df/dx){a, b) e {dl/dy){a, b) =
{df /dy){a,b) {I e as derivadas parciais de primeira ordem de I coincidem
com / e as derivadas parciais de primeira ordem de / no ponto (a, 6), res­
pectivamente) ou, equivalentemente, é o único plano que satisfaz a condição

f{x,y)-l{x,y)
Ito J íl^ lÍ ü L = Um = 0.
(x,y)^{a,b) ||(x —a, y —Ò)|| (x,y)-^{a,b) -y/(x — a)^ + { y — 6)^

A equação do plano tangente define o polinómio de Taylor de ordem 1 de / no


ponto (a, 6): pi{x,y) = f{a,b) + {df/dx){a, b)-{x-a) + {df/dy){a,b)-{y-b).
Em notação mais compacta,

pi(x) = /(p ) + Df {p) • (x - p),

onde X = ( x , 2/) e p = (a, b).


Agora, podemos nos perguntar qual é a “melhor” quádrica (polinómio
de grau dois em duas variáveis) que aproxima uma função / : R^ —> R de
classe em uma vizinhança de um ponto (a, 6). A resposta é dada pelo
próximo teorema.
11.2 Polinómios de Taylor 379

T eorem a 1X,5 (O POUNÔMIO DE T aYlor de ORDBM 2) Considere


uma função / : £> C -)• R de classe CP' e (a, h) um ponto do interior
de D. Então existe um único polinómio p2 de grau 2 que satisfaz as

(a) os valores das funções íJ2.e / coincidem ern (o, 6):

m{a,h) = l{a ,b ),

(b) os valores das derivadas parciais de primeira ordem de p2 e / coin­


cidem em (o, 6):

^ ^ (n b)
-g-(a. h\ = ín h\
6), M = - ^ ( (n
gp-(a, b) a , hb),
~\

(c) os valores das derivadas parciais de segunda ordem de P2 e / coin­


cidem em (o, 6):

u\ —
•(a,o) „ d'^P2,(n ,0) —
_
dx^ dy^ (a, 6),
d"^P2
dydx''~’~^ dxdy ’ dxdy^ ’ ‘ d yd x'

a saber, o polinómio de Taylor de ordem 2 de / no ponto (a, b);

P2 {x, y) — B • {x ~ a) + C ■{y - h)p-


- D.(x-a)2 + E.(a:-a)-(í/-6)-fE.(y-6)^

A (n,6),
dy

Mais ainda, vale que

lim - ^ íi^, y)-p2Í<c, y) _= 0,


[x,i/)-^{a,b) 11(a: —a, 1/ —6)(P {v,y)~*{af>) ( - ^ [ x - a p + (^ —6)^)^
380 Otimização sem restrições

l iKrtWiiM ÍÍÍÉ iB ÍB ÍÍiÍÍilÍͧÍlilS ÍiipllliliB iifiiÍÍ^^

ÍMMtfftB § iÍÍiÍÍy Í^ Í^ ^ p Í|iih iÍÍS Í!É B |^ ;lilÍiill

lim 777- W M ^ ív lllllliii


iiiiiiiilll
ia iliil

O polinómio de Taylor p 2 de / no ponto (a, 6) pode ser codificado com o uso


de matrizes; escrevendo x = {x,y) e p = (a, 6), temos

P2(x) = /(p) + Df {p) • (x - p) + - • (x - p)^ • £>V(P) • (x - p),

onde 0 símbolo ^ indica a operação de transposição de matrizes, Df {p) é a


matriz jacobiana de / no ponto p = (a, 6) e D ‘^ f{p) é a matriz hessiana de /
no ponto p = (o, b):

dxdy^^^
Dfip) = , -c>V(p) =
dydx^^^

O erro i?2(p,x) = /(x ) —P2(x) entre as funções f e p 2 satisfaz a condição


lim x -4 p -R (p ,x )/||x - p||2 = 0.

Exercício resolvido 11.2 Use os polinómios de Taylor de ordem 1 e 2 da


função z = f { x , y) = x^l^y^l^ no ponto p = (1,1) para obter uma apro­
ximação de / ( l . 1,0.9).

S olução : A s derivadas parciais de primeira ordem de / são dadas por

|^ ( x , y) = i e |^ ( x , y) = ^ x ^ l Y ^ ' \
11.2 Polinómios de Taylor 381

e, as derivadas parciais de segunda ordem, por

f ( \ 3 3/4 f ^ . 3 _5M
5 ^ .2 V ^y) iQ y ^ Qy2\ ^y) 16 ^

aV

Desta maneira,

^ ( 11) ^ ( 11) 1 3
^ /( i,i) =
4 4

- 3 3 ■
“ l6 16
ay 3 3
dydx (1,1) 0 ( 1 ,1 ) - 16 16 -

Conseqüentemente,

Pi(a:, y) = / ( l , 1) + I> /(1 ,1) • ( y , y) - (1,1)) =


■1 3 ■ X —1
1 + = —X 4— V
4 4^
. 4 4 . . 2 /- 1 .

P2(x, y) = pi{x, y) + - {{x, y) - (1,1))^ • £>V(1,1) • ((x, y) - (1,1)) =

3 3 -
1 3 Ir , , 1 16 16 X —1
i^+ jy+ o y-^\ 3 3 y -1
16 “ l6 -

r + iy -^ 2 ^ +16"^"32^-
Sendo assim, p i(l.l,0 .9 ) = (1/4) (1.1) + (3/4) (0.9) = 0.95 e p2(l.l,0.9) =
(1/4) (1.1) + (3 ^ ) (0.9) - (3/32) (1.1)2 ^ j) (0.9) - (3/32) (0.9)^ =
0.94625, enquanto que / ( l . l , 0.9) = ( l.l)i/‘*(0.9)3/‘^ = 0.9463026.... ,

Evidentemente, podemos construir o polinómio de Taylor de ordem 2 para


funções de classe Cf^ que dependam de mais do que duas variáveis.
382 Otimização sem restrições

I B M ^ J |jif iiiÍ s Í Í a lÉ ip B p ||||lH Í |||||g p ^ ^

M h i i l i l i É B S i É i i i i íl B i ^ i f c

g |^ l ||||S l |9 i |||i Í f l i |Í i Í ||||y 8 j Í Í ||i |i . ||l |||ã ^ ; |( ||n a

P ilHiliiliM

dx^dxi iiliiiiM l lillilii

S li'8 8 l^ p íü i
é a matriz hessiana de / no ponto p. Mais ainda, vale que
/( x ) = p 2(x) + i?2(p,x),
iiliS lf tif c lii^ ifc jtf c § if t§ te iii^ § p iiiW f iiiiiil i |B j |||j || ||M

x^pllX—piP x-»p ||x —pll^:


isto é, O erro i?2(p ,x ) vai para zero mais rapidamente do que o qua­
drado da distância entre p e x.

Para demonstrar este teorema, ao invés de tentar determinar os coefici­


entes do polinómio de Taylor resolvendo-se o sistema linear obtido a partir
das condições p2(p) = /(p ), Df {p) = Dp 2{p) e D^f{p) = D^p2 {p) (técnica
que usamos no capítulo 7), podemos fazê-lo usando as propriedades do po­
linómio de Taylor de uma função de uma única variável estabelecidas na
subseção anterior. Os detalhes desta demonstração podem ser encontrados
nas referências [01, 71].
11.3 Formas quadráticas e matrizes definidas 383

11.3 Formas quadráticas e m atrizes definidas

Como usar o polinómio de Taylor de ordem 2 para classificar pontos


críticos de uma função / de n variáveis? Como vimos, se / ; D C ^ Ké
uma função de classe e p é um ponto interior de D, então

/(x ) = /(p ) + jD / ( p ) • (x - p ) + ^ • (x - p )^ • I ? V ( p ) • ( x - p ) + i ? 2( p , x ) .

Se p é um ponto crítico de / , então i? /(p ) = 0 e, portanto,

/(x) = /(p) + ^ • (x - p)^ • í?V(p) • (x - p) + i?2(p, x).

Usando a variável h = x —p (que representa o deslocamento com relação


ao ponto p) e negligenciando o erro i?2(p, x) (que vai para zero rapidamente
quando x —> p), concluímos que

/ ( p + h) « /(p ) + 2 • • -^ V (P ) • h,

isto é.

/ ( P + h) - / ( p ) ~ 2 ■ ^

Se o lado direito da expressão acima é maior do que zero para todo h 7^ 0


suficientemente pequeno, então o lado esquerdo também deve ser maior do
que zero:

/ ( p + h) - / ( p ) > 0 ou /(p + h ) > / ( p ) ,

para todo h 7^ 0 suficientemente pequeno. Desta maneira, p é um mínimo


local de / . Analogamente, se • D ^ /(p ) • h é menor do que zero para
todo h 7^ 0 suficientemente pequeno, então o lado esquerdo também deve
ser menor do que zero:

/ ( p + h) - /( p ) < 0 ou /(p + h ) < / ( p ) ,

para todo h 7^ 0 suíicientemente pequeno. Desta maneira, p é um máximo


local de / . Moral da história: a aproximação de Taylor indica que o fato de
p ser um extremo local de / está intimamente relacionado com 0 sinal do
polinómio de grau 2 em várias variáveis
384 Otimização sem restrições

Q (h) = h ^ . p V ( p ) - h ,

onde D"^f (p) é a matriz hessiana de / no ponto crítico p. Punções deste tipo
são tão importantes que vamos dar um nome para elas.

D e fin iç ã o 1 1 . 1 ( F o r m a s q u a d r á t i c a s ) Seja A uma matriz quar


. diradá n x n formada por números reais, A forma quadráUca associada
. à matriz A é a função escalar, , • , .

• \v , Q: . m^ - f . n . .
' K. • A >h !

'h
h2
Q { h i , h , . . . , h n ) ^ [ h h2 ••• K ] y “f 7 T
On,l ■■■ On,n. .^ .

iü iia i

onde, como sempre, estamos identificando matrizes 1 x 1 com números

Como 0 sinal de Q(h) = h^-A-h também desempenha um papel importante,


somos levados a considerar a seguinte definição.

' D e fin iç ã o 1 1 .2 (M atrizes definidas e semidefinidas) Sejam A


uma matriz n x n e <5(h) = • A • h a forma quadrática associada.

(a) A m atriz A (on a forma quadrática Q ) é posiüva definida se

'. para t o d o h ? ^ O e m ® ’‘
11.3 Formas quadráticas e matrizes definidas 385

'(b)-,A inairte A (ou á fôrma quaárática Q^ ‘'é:posiiiva/s'em défi^^

' p a íá tb d o h 7^ 0;lêm']8“ . '' • ' ' *' '

(c) A matriz A (om a forma quadrática Q) é negativa definida se

|i|||||||i® |i|||i|i|ii|||||||||||||illl|l|iii® ^
para todo h jí O em K” . ;

(d) A matriz A (ou a forma quadrática Q) é negativa semtdefinida se

Q (h) = h ^ - A . h < 0

para todo h 7<^0 em K” . ,


iiiP
(e) A matriz A (ou a forma quadrática Q) é ináefimddse existem h e k
em R” tais que |

g(h) = h ^ . A . h > 0 e g(k) = k ^ . A- k < 0 .

Observe que toda forma quadrática g(h) = • A • h satisfaz

Q (0) = 0^ • A • 0 = 0.

E x e m p lo 11.3 A matriz

1 0
A=
0 1

é positiva definida pois a forma quadrática associada,

'IO' ’ h,-
Q{hi, h2) = [ /ii /i2 ] — h\ + h.2,
. 0 1.
é maior do que 0 para todo (fii, /12) ^ (0,0). Veja a figura (11.5).
386 Otimização sem restrições

Figura 11.5: Gráfico da forma quadrática positiva definida Q{hi, /12) = + hl-

Exem plo 11.4 A matriz

-1 0
B =
0 -1

é negativa definida pois a forma quadrática associada,

■- 1 0 ■ 'hl'
Q { h \ , h 2 ) = [ h i /i2 ] = -h\ - hl
0 -1 . ^2 .

é menor do que 0 para todo (hi, hl) 7^ (0,0). Veja a figura (11.6).

Exem plo 11.5 A matriz

1 0
C=
0 -1

é indefinida pois a forma quadrática associada,

■ 1 0 ■ 'hl'
Q{h\, hl) = [ fii ] = h l - hl
0 -1 . ^2 .

é tal que <5(1,0) = 1 > 0 e <5(0,1) = —1 < 0.


11.3 Formas quadráticas e matrizes definidas 387

Figura 11.6: Gráfico da forma quadrática negativa definida Q(/ii, /12) = —h\ — h\.

Figura 11.7: Gráfico da forma quadrática indefinida Q (/ii, /Í2) = h\ — K\


388 Otimização sem restrições

Exem plo 11.6 A matriz

1 0
D=
0 0

é positiva semideíinida pois a forma quadrática associada,

'IO ' ■fil‘ = h\,


Q{hi, h^) = [ /i2 ]
_0 0_ /l2

é maior ou igual a 0 para todo {h\, /12) ^ (0,0). Veja a figura (11.8). Observe
que D não é positiva definida pois (5(0,1) = 0. b

Figura 11.8: Gráfico da forma quadrática positiva semideíinida Q{h\, /i2 ) = h\.

Exem plo 11.7 A matriz

-1 0
E =
0 0

é negativa semideíinida pois a forma quadrática associada.

■- 1 0■ hl
(5(fii, fiz) = [ fii fiz ] = -hl
0 0_ . ^2 .
11.3 Formas quadráticas e matrizes definidas 389

é menor ou igual a 0 para todo (/ii, /12) 7^ (0, 0). Veja a figura (11.9). Observe
que E não é negativa definida pois Q (0,1) = 0. ■

Figura 11.9: Gráfico da forma quadrática negativa semidefinida Q(/ii, /Í2) =

Exercício resolvido 11.3 Considere a matriz diagonal

dl 0 0 0
0 d2 0 0
D=
0 0 da 0
0 0 0 d4

Para quais valores de di, d2, da e d4 a matriz D é positiva definida, negativa


definida, positiva semidefinida, negativa semidefinida e indefinida?

S olução : A forma quadrática associada a matriz D é dada por

dl 0 0 0 ~h l -
0 d2 0 0 h2
Ç ( ^ i ) ^3) ^^4) = [ hl h2 /ia /i4 ]
0 0 da 0 h^
0 0 0 d4 /i4
= d l /i^ -j- (Í 2 /i2 "h da /ia d4 /i^.

Sejam ei = (1, 0, 0, 0), 02 = (0, 1, 0, 0), ea = (0, 0, 1, 0) e 04 = (0, 0, 0, 1) os


vetores da base canônica de .
390 Otimização sem restrições

(a) Se D é uma matriz positiva definida, então devemos ter Q(ei) = di > 0,
(5 (02) = ^2 > 0, Q(ea) = da > 0 e Q(e4) = d4 > 0. Por outro lado, se di,
d2, da e são todos maiores do que 0, então D é positiva definida pois

Q(/^l, /i2, hs, h4) = dihl + d2 hl + da ^3 + d4 /i4 > 0

para todo (/ii, /i2j h^j h^) G e

Q{hi^ /i2, /^a? ^4) = 0 se, e somente se, h\ = h 2 = hs = h4 = 0.

(b) Se D é uma matriz negativa definida, então devemos ter Q(ei) = di < 0,
Q(e2) = d2 < 0, Q(ea) = da < 0 e (5 (04) = d^ < 0. Por outro lado, se di,
d2, da e d4 são todos menores do que 0, então D é negativa definida pois

Q{hij /i2, /la5h^) = dl hl d2 hl + da /13 + d4 /14 < 0

para todo (/ii, /12, /la, /14) G e

Q(/ii, /i2, /la, /14) = 0 se, e somente se, /ii = /12 = /la = /14 = 0.

(c) Se D é uma matriz positiva semidefinida, então devemos ter Q(ei) =


dl > 0, Q(e2) = d2 > 0, Q(ea) = da > 0 e Q{e4) = d^ > 0. Por outro
lado, se di, d2, da e d4 são todos maiores ou iguais a 0, então D é positiva
semidefinida pois

Q(/ii, /12, /la, /14) = dl /i| + d2 /12 + da /13 + d4 /14 > 0

para todo (/ii, /12, /13, /14) G

(d) Se D é uma matriz negativa semidefinida, então devemos ter Q(ei) =


dl < 0, Q{e 2) = d2 < 0, Q(ea) = da < 0 e Q{e4) = d4 < 0. Por
outro lado, se di, d2, da e d4 são todos menores ou iguais a 0, então D e
negativa semidefinida pois

Q(/ii, /i2, /13, /14) = dl /i^ + d2 /12 + da /13 + d4 /14 < 0

para todo (/ii, /12, /13, /14) G


(e) Se Z? é uma matriz indefinida, então algum di deve ser menor do que
zero pois, se todos os di forem maiores ou iguais a zero, então D seria
uma matriz positiva semidefinida e não uma matriz indefinida. Analo­
gamente, algum dj deve ser maior do que zero pois, se todos os dj forem
11.3 Formas quadráticas e matrizes definidas 391

menores ou iguais a zero, então D seria uma matriz negativa semidefinida


e não uma matriz indefinida. Resumindo, se D é uma matriz indefinida,
então dois elementos da diagonal de D devem ser diferentes de zero e
devem possuir sinais contrários. Por outro lado, se dois elementos da
diagonal de D são diferentes de zero e possuem sinais contrários, então
D é uma matriz indefinida pois se < 0 e dj > 0, então Q{ei) = di < 0
e Q{ej) = dj > 0 . B

Com estas definições podemos, finalmente, enunciar o teorema de classi­


ficação de pontos críticos, baseado na positividade da matriz hessiana.

T eorem a 11.7 ( C o n d iç õ e s d e s e g u n d a o r d e m ) Considere uma


função f D C W M de classe e p um ^ponto, crítico de / no
interior do conjunto D.
(a) Se D ^/(p) é uma matriz positiva defimda, eiitão p é um pònto dê
mímmo local de f ,
(b) Se jD^/( p ) é uma matriz negativa defimda, então p é um ponto de
máximo local de /
(c) Se D ^/(p) é uma matriz indefinida, então p é um ponto de sela
de / , isto é, p é um pontò crítico que não é mínimo locai e nem
máximo local de /
(d) Se D ^/(p) é uma matriz positiva semidèfinida ou uma matriz nega- =
tiva semidefinida, então p é um ponto de máximo local, um ponto
de mínimo locai ou um ponto de sela de / .

O item (d) do teorema acima diz que se p é um ponto crítico de / e a


matriz hessiana D‘^ f{p) de / em p é positiva semidefinida ou negativa se­
midefinida, então as condições de segunda ordem não conseguem classificar
0 ponto crítico p. Para ver isto, considere as funções /(x ,y ) =
g{x^y) = — y^ ^ h{x) = O ponto p = (0,0) é ponto crítico
das três funções e a matriz hessiana destas três funções em p = (0, 0) é a
matriz nula que é uma matriz positiva semidefinida e uma matriz negativa
semidefinida ao mesmo tempo (nesta situação, dizemos que p é um ponto
crítico degenerado de /) . Mas p = (0, 0) é um ponto de mínimo local de / ,
392 Otimização sem restrições

um ponto de máximo local de ^ e um ponto de sela de h (por que?). Uma de­


monstração do teorema das condições de segunda ordem pode ser encontrada
na referência [71].

Exem plo 11.8 No exemplo (11.1) vimos que os únicos pontos críticos da
função z = f{ x , y ) = + 9 xy no conjunto admissível D = são.
Pi = (0,0) e P2 = (3 ,-3 ). Como todos os pontos do conjunto admissível
são pontos interiores, segue-se que Pi e P2 são os únicos candidatos a ex­
tremo local de / . Vamos aplicar as condições de segunda ordem para tentar
classificar estes pontos críticos. Para isto, vamos calcular a matriz hessiana
D‘^ f{x,y) de / no ponto (x,y):

6x 9
D'^f{x,y) =
0(x.í) 9 -6y

(a) Classificação do ponto crítico pj = (0,0).


A matriz hessiana Z)^/(0,0) de / no ponto (0,0) é dada por

0 9
z?V(0,0) =
9 0

e a correspondente forma quadrática por

’0 9‘ ■ fii'
Q{h\, /12) = [ fii fiz ] = 18 fiifi2.
9 0 .^ 2 .

Devemos agora estudar o sinal de Q(fii, fi2). Se conseguirmos dois pontos


(fii,fi2) e {ki,k 2) para os quais Q{h\,h 2) > 0 e Q{ki,k 2) < 0, então
D ^ /(0 ,0) será uma matriz indefinida e, conseqüentemente, (0,0) será
um ponto de sela de / . Por outro lado, conseguir alguns pontos onde Q
é maior do que 0 não garante que D^ f { 0 , 0) seja uma matriz positiva
definida. Analogamente, conseguir alguns pontos onde Q é menor do
que 0 não garante que D ^ /(0 ,0) seja uma matriz negativa definida.
Contudo, neste caso, é fácil de se classificar a matriz hessiana D ^ /(0 ,0)
de / no ponto (0,0). Uma vez que

Q ( l,l) = 1 8 > 0 Q ( l,- 1 ) = - 1 8 < 0


11.3 Formas quadráticas e matrizes definidas 393

segue-se que D ^/(0,0) é uma matriz indefinida e, portanto, pelas con­


dições de segunda ordem, (0,0) é um ponto de sela de / , isto é, (0, 0) é
um ponto crítico de / que não é mínimo local e nem máximo local de / .

(b) Classificação do ponto crítico P2 = (3, —3).


A matriz hessiana D^/(3, —3) de / no ponto (3, —3) é dada por

18 9
DV(3, -3 ) =
9 18

e a correspondente forma quadrática por

■18 9 ■ ■/ii ■
Q(/il,/i2) = [ h i /l2 ] = 18 + 18 h\h2 H” 18 /i2*
_ 9 18 > 2.

Devemos agora estudar o sinal de Q{h\^ Se conseguirmos dois pontos


(/ii,/i2) e (fci,fc2) para os quais Q(/^l,/i2) > 0 e Qiki.k^) < 0, então
í?^/(3, —3) será uma matriz indefinida e, conseqüentemente, (3, —3) será
um ponto de sela de / . Por outro lado, conseguir alguns pontos onde Q
é maior do que 0 não garante que D^/(3, —3) seja uma matriz positiva
definida. Analogamente, conseguir alguns pontos onde Q é menor do
que 0 não garante que —3) seja uma matriz negativa definida.
Analisar o sinal de 18/if + I 8 /11/12 + 18 é mais complicado do que
analisar o sinal de I 8 /Í1/12!
Para classificar a matriz hessiana —3) de / no ponto (3, —3) va­
mos usar o método de Lagrange^ que consiste em completar os quadrados
na expressão para Q{h\^ h 2):

Q(/ii, /Í2) — 18 + hih2 + /Í2] ~


2
1
18 /ll + — /i2 ) “ “7 ^ 2 "h ^ 2 = 18 /ll + - /i2 ) + 7 ^2
2 “ 4

Observe que Q (/ii,/i2) > 0 para todo (/í i ,/ í2) € e Q{hi^h 2) = 0 se,
e somente se, h\ = h 2 = 0. Isto mostra que D^/(3, —3) é uma matriz
positiva definida e, portanto, pelas condições de segunda ordem, (3, —3)
é um ponto de mínimo local de / . b
394 Otimização sem restrições

C U ID A D O ! C U ID A D O ! C U ID A D O !

As condições de segunda ordem estabelecem um critério para decidir


se um ponto crítico é um extremo locaü Elas nada afirmam sobre a
globalidade do ponto crítico! No exemplo anterior, (3, —3) é um mínimo
local de
2 = f{x, y) - y ^ + 9xy
mas (3 ,-3 ) não é um mínimo global de / em Para vê-lo, basta
observar que /(O, n) = — que vai para —oo quando n vai para -l-oo.

Existem várias maneiras de se estudar o sinal de uma forma quadrática

Q(h) = •A •h

associada a uma matriz simétrica A:

(a) com o completamento de quadrados de Q(h) (conhecido como o método


de Lagrange),

(b) com 0 cálculo dos autovalores de A, isto é, com cálculo das raízes do
polinómio característico de A,

(c) com o cálculo dos determinantes de certas submatrizes de A (os assim


denominados menores principais de A) e

(d) com a decomposição de Cholesky de A (relacionada com a decomposição


LU de A).

No exemplo (11.8) usamos o método de Lagrange para classificar o ponto


crítico (3, —3) da função z = /(x , y) = + 9 xy.
A decomposição de Cholesky constitui o método computacionalmente mais
eficiente para se determinar a positividade de uma matriz. Contudo, gas­
taríamos muito tempo para estabelecer os pré-requisitos de Álgebra Linear
necessários para o entendimento da decomposição de Cholesky. Ao invés
disto, vamos descrever como classificar a forma quadrática Q(h) = •A •h
em termos de determinantes, o que será satisfatório para nossos propósitos
neste curso.
11.4 Menores de uma matriz 3d5

11.4 M enores de um a m atriz

D efinição 11.3 ( M e n o r d e u m a m a t r i z ) Seja A uma matriz n x n ..


Um menor de ordem k ê o determinante de uma submatriz k x k de
A obtida removendp-se n — k Imbas e n — k colunas de A.

Exem plo 11.9 Considere a matriz 3 x 3

a b c
A = d e f
_g h i

Os menores de ordem 1 da matriz A são dados por

kl. kl. |c kl. kl. I/I. kl. kl I•

Os menores de ordem 2 da matriz A são dados por

e / d f d e
h i )
9 i 9 h

b c a c a b
h i 5 9 i
)
9 h

b c a c a b
e f 7 d f
) d e

O menor de ordem 3 da matriz A é dado por

a b c
d e f
9 h i

O símbolo |A| denota o determinante da matriz A (não confunda com o


módulo de um número real). b
396 Otimização sem restrições

■ tíefih içâòi.11.4 ( M e n o r p r i n c i p a l d e u m a m a t r i z ) Um menor


l. pfinctT^al de ordem k é um menor de ordem k no qual as mesmas
;;.yipíjSaSí e colunas foram removidas. Mais especificamente, se as linhas; -
então as colunas removidas são as de

E xem plo 11.10 Considere a matriz 3 x 3

a b c
A= d e f
_g h i _

Os menores principais de ordem 1 da matriz A são dados por

|o|, |e| e |t|.

Os menores principais de ordem 2 da matriz A são dados por

e / a c a b
h i J d e
9 i

O menor principal de ordem 3 da matriz A é dado por

a b c
d e f
9 h i

O símbolo |yl| denota o determinante da matriz A (não confunda com o


módulo de um número real). ^

D efinição 11.5 Um menor prtnctpal líder de ordem k é um menor


principal de ordem fí onde foram removidas aã últimas n —k linhas e
n —k colunas.
11.4 Menores de uma matriz 397

Exem plo 11.11 Considere a matriz 3 x 3

a b c
A= d e f
.9 h i _

Os menores principais líderes de ordem 1, 2 e 3 de A são dados, respectiva-


mente, por

a b c
a b
d e f
d e
9 h i

O símbolo 1>1| denota o determinante da matriz A (não confunda com o


módulo de um número real). a

Teorema 11.8 (CiASSiFiCAÇÃo de form as q u a d r á t ic a s via


MENORES Seja A uma inatnz n x n simétrica. Denote
pr in c ipa is )
por \Ak\ 0 menor principal líder de ordem k de A.
(a) A é uma m atnz positiva definida se, e somente se, todos os menores
principais líderes |A i|,. . . . |Anj de A são maiores do que zero.
(b) A é uma matriz negativa definida se, e somente se, todos os me­
nores principais líderes de ordem ímpar são menores do que zero
e todos as menores principais líderes de ordena par são maiores do

(c) A é uma matriz positiva semidefinida se, e somente se, todos os


menores principais de A são maiores ou iguais a zero.
(d) A é uma matriz negativa sermdefinida se, e somente se, todos os
menores principais de ordem ímpar de A são menores ou iguais a
zero e todos os menores principais de ordem par de A são maiores
ou iguais a zero,
(e) Se A não se enquadra em nenhum dos quatro casos miteriores,
então A é uma matriz indefinida.
398 Otimização sem restrições

Exem plo 11.12 Suponha que A é uma matriz 4 x 4 simétrica. Denote por
lAjfel 0 menor principal líder de ordem k.

(a) Se |Ai| > 0, 1^ 2! > 0, > 0 e IA4I > 0, então A é uma matriz positiva
definida.

(b) Se |Ai| < 0, \A 2 \ > 0, l^lal < 0 e lA^] > 0, então A é uma matriz negativa
definida.

(c) Se 1^ 11 > 0, {A^l > 0, IA3I = 0 e \A4\ < 0, então A é uma matriz
indefinida. De fato: A não é positiva definida por causa de IA4I (deveria
ser > 0 e não < 0), A não é negativa definida por causa de |Ai| (deveria
ser < 0 e não > 0), ^4 não é positiva semidefinida por causa de |^ 4|
(deveria ser > 0 e não < 0), ^ não é negativa semidefinida por causa de
1^ 11(deveria ser < 0 e não > 0 ). Se ^ não é definida e nem semidefinida,
concluímos que A é indefinida.

(d) Se |Ai| < 0, |v4.2| < 0, IA3I < 0 e \A4\ < 0, então A é uma matriz
indefinida. De fato, A não é positiva definida por causa de \A4\ (deveria
ser > 0 e não < 0), A não é negativa definida por causa de 1^ 4! (deveria
ser > 0 e não < 0), A não é positiva semidefinida por causa de \A4\
(deveria ser > 0 e não < 0), A não é negativa semidefinida por causa de
I.A4I (deveria ser > 0 e não < 0). Se A não é definida e nem semidefinida,
concluímos que A é indefinida.

(e) Se |Ai| = 0, IA2I < 0, IA3I > 0 e \A4\ = 0, então A é uma matriz
indefinida. De fato, A não é positiva definida por causa de IA2I (deveria
ser > 0 e não < 0), A não é negativa definida por causa de \A 2\ (deveria
ser > 0 e não < 0), >1 não é positiva semidefinida por causa de \A 2\
(deveria ser > 0 e não < 0), A não é negativa semidefinida por causa de
IA2I (deveria ser > 0 e não < 0). Se A não é definida e nem semidefinida,
concluímos que A é indefinida.

(f) Se l^il > 0, \A2 \ = 0, lylsl > 0 e IA4I > 0, então A não é uma matriz
definida. Certamente A não é negativa semidefinida (pois 1^431 > 0).
Assim, A pode ser positiva semidefinida ou indefinida. Para decidir se A
é positiva semidefinida é preciso calcular todos os menores principais de
A e não apenas os quatro menores principais líderes. Se nenhum menor
principal é negativo, então A é positiva semidefinida. Se pelo menos um
dos menores principais é negativo, então A é indefinida.
11.4 Menores de uma matriz 399

(g) Se \Ai\ = 0, IA2I > 0, IA3I = 0 e IA4I > 0, então A não é uma matriz
definida. Assim, A pode ser positiva semidefinida, negativa semidefinida
ou indefinida. Para decidir sobre a classificação de A devemos calcular
todos os menores principais da matriz A. 1

Exem plo 11.13 No exemplo (11.1) vimos que os únicos pontos críticos da
função 2^ = /(x ,y ) = + 9 xy no conjunto admissível D = são
Pi = (0,0) e P2 = (3, —3). Como todos os pontos do conjunto admissível
são pontos interiores, segue-se que Pi e P2 são os únicos candidatos a ex­
tremo local de / . No exemplo (11.8) usamos as condições de segunda ordem
para classificar estes pontos críticos estudando a positividade dcis matrizes
hessianas

0 9 18 9
A = D^f{0,0) = B = -3 ) =
9 0 9 18

Para isto, calculamos explicitamente as formas quadráticas associadas a estas


matrizes e empregamos o método de Lagrange (completamento de quadra­
dos) para classificá-las como positiva definida, negativa definida, positiva
semidefinida, negativa semidefinida ou indefinida. Vamos usar agora o teo­
rema (11.8) como um método alternativo para classificar as matrizes A e B.

(a) Classificação do ponto crítico = (0, 0).


Como \A2 \ = —81 < 0 segue-se que A não é positiva semidefinida (pois
IA2I deveria ser > 0 e não < 0) e nem negativa semidefinida (pois \A2 \
deveria ser > 0 e não < 0). Com isto, A também não é positiva definida e
nem negativa definida. Logo, A é indefinida e, conseqüentemente, (0,0)
é um ponto de sela de / .
(b) Classificação do ponto crítico P2 = (3, —3).
Como |5 i| = 18 > 0 e IB2I = 18^ — 9^ > 0 segue-se que todos os
menores principais líderes de A são > 0. Logo, A é positiva definida e,
conseqüentemente, (3, —3) é um ponto de mínimo local de / . g

A demonstração do teorema (11.8) não é simples e, com a teoria que temos


até aqui, ele não parece ser nada óbvio. Na referência [71] você pode encon­
trar uma demonstração por indução do teorema em sua forma mais geral.
Por outro lado, existem situações mais simples onde 0 teorema (11.8) pode
400 Otimização sem restrições

ser facilmente estabelecido. Vamos estudar dois destes casos: a positividade


de matrizes diagonais e a positividade de matrizes simétricas 2 x 2 .
E xem plo 11.14 (P ositividade de matrizes diagonais) No exercício
resolvido (11.3) estudamos a positividade de uma matriz diagonal 4 x 4 .
Não é difícil de se ver que as conclusões estabelecidas neste exercício podem
facilmente ser generalizadas para matrizes diagonais n x n, isto é, se

dl 0 •• 0
0 d2 ■•• 0
D=
0 0 - • dji

então 0 estudo do
associada a D,

dl 0 0 'h l '
0 d2 0
^ ( / i l , /l2) • • • ) ^ n ) — [ ^2 *** hji j . h2

0 0 dji hn
— d\ 2 1 d2
j h,2 +, I ^ l2
+ dn

nos permite concluir que

(a) D é uma matriz positiva definida se, e somente se, todos os elementos da
diagonal principal de D são positivos, isto é, di > 0, ^2 > 0, . . . , > 0,
(b) D é uma matriz negativa definida se, e somente se, todos os elementos da
diagonal principal de D são negativos, isto é, di < 0, ^2 < 0, . . . , < 0,
{c) D é uma matriz positiva semi definida se, e somente se, todos os elementos
da diagonal principal de D são maiores ou iguais a zero, isto é, d\ > 0,
d2 > 0, . . . , dn > 0,
(d) D é uma matriz negativa semidefinida se, e somente se, todos os ele­
mentos da diagonal principal de D são menores ou iguais a zero, isto é,
dl < 0, d2 < 0, . . . , dn < 0 e
(e) D é uma matriz indefinida se, e somente se, existem dois elementos da
diagonal principal de D com sinais contrários, isto é, existem índices i e
j tais que d^ > 0 e dj < 0.
11.4 Menores de uma matriz 401

Lembrando que o determinante de uma matriz diagonal nada mais é do que


o produto dos elementos da diagonal, é fácil de ver que os menores principais
líderes de D são:

\Di\ = dl, ID2I = dl • d2, \^n\ —dl • d2........dfi.

Com isto, não é difícil de se ver que

(a) D é uma matriz positiva definida se, e somente se, todos os menores
principais líderes de D são positivos, isto é, |Di| > 0, |í?2| > 0, ID3I > 0,
\D^\ > 0, . . . , \Dn\ > 0 e
(b) D é uma matriz negativa definida se, e somente se, todos os menores
principais líderes de ordem ímpar de D são negativos e todos os menores
principais líderes de ordem par de D são positivos, isto é \Di\ < 0,
11^21 > 0, \Ds\ < 0, > 0, etc.

Por outro lado, o fato de todos os menores principais líderes de D serem


maiores ou iguais a zero não garante que D seja uma matriz positiva semi-
definida. Por exemplo, se di = 0 e todos os demais elementos da diagonal
de D são negativos, então os menores principais líderes de D são todos iguais
a zero mas D não é uma matriz positiva semidefinida. Moral da história:
para decidir se D é semidefinida ou indefinida não basta estudar apenas os
sinais do menores principais líderes de D\ E preciso estudar os sinais de
todos os menores principais! Como as submatrizes principais de D também
são matrizes diagonais, segue-se que

(c) D é uma matriz positiva semidefinida se, e somente se, todos os menores
principais de D são maiores ou iguais a zero e

(d) D é uma matriz negativa definida se, e somente se, todos os menores
principais de ordem ímpar de D são menores ou iguais a zero e todos os
menores principais de ordem par de D são maiores ou iguais a zero.
(e) Caso os sinais dos menores principais da matriz D não se enquadrem nos
itens (a), (b), (c) e (d), concluímos que D é uma matriz indefinida. ^

E xem plo 1 1 .1 5 (POSITIVIDADE DE MATRIZES SIMÉTRICAS 2 x 2 ) Consi­


dere uma matriz simétrica 2 x 2
402 Otimização sem restrições

a b
b c

e a forma quadrática associada

a b 'h '
Q(/il,/l2) = [ h i /l2 ] — CL -f" 2ò /11/12 “h c /l2-
b c > 2.

(a) A é positiva definida se, e somente se, |Ai| = a > 0 e \A2 \ = ac —b‘^ > 0.
(=4>) Se A é uma matriz positiva definida, então Q(1,0) = a > 0 e
Q{—b/a, 1) = —^ j a + c = (ac —ò^)/a > 0. Portanto, |Ai| = a > 0 e
IA2I = ac —6^ > 0.

{<=) Reciprocamente, se |Ai| = a > 0 e \A2 \ = ac —b^^ > 0, completando-


se o quadrado, temos que

52 ^2
/12) ~ a -|- 2ò /11/12 H----^2 —— ^2 d" c /i2
a a

— aI H---- a ia22HH
—h\h ——^5 j —— è! /12 c /12
a a^ a
2
/L ^ L ^ ^ ac —b^
— a ( /ii H— ^2 1 H---------- hl
a / a

é maior ou igual a zero para todo (/ii, /i2) G Mas se Q(/ii, /Í2) = 0,
então hl = 0 e h 2 = 0. Portanto, Q (/ii,/i2) > 0 para todo (/ii,/i2) 7^
(0, 0), isto é, é uma matriz positiva definida.

(b) A é negativa definida se, e somente se, |Ai| = a < 0 e |^ 2| = ac —6^ > 0.
(=^) Se A é uma matriz negativa definida, então Q(1,0) = a < 0 e
Q(—ò/a, 1) = —ò^/a + c = (ac —ò^)/a < 0. Portanto, \Ai\ = a < 0 e
|yl2| = ac —6^ > 0.

(-^) Reciprocamente, se |Ai| = a < 0 e \A 2 \ = ac —b^>0, completando-


11.4 Menores de uma matriz 403

se o quadrado, temos que


^2 ^2
/12) “ u H “ 26/12/12 H----6^2------ h2 ~ \ ~ ch ^
CL CL
b \.
CL ^ fll -\-------------/ I 1 / I 2 H ------------ 2 ^2 ) ll2 ~\~ c ll 2
---------------
CL CL J CL

6 , \ ^ ac — l?
— a \ h\-\— /i2 I + hl
a J a

é menor ou igual a zero para todo (/ii, /12) E Mas se Q(/ii5^ 2) = 0,


então /ii = 0 e /i2 = 0. Portanto, Q (/ii,/i2) < 0 para todo (/í i ,/ í2) 7^
(0,0), isto é, A é uma matriz negativa definida.

(c) A é positiva semidefinida se, e somente se, a > 0, c > 0 e ac —6^ > 0.
Se A é uma matriz positiva semidefinida, então Q(1,0) = a > 0,
Q(0,1) = c > 0. Temos agora que considerar vários subcasos.
1. Se a > 0, então Q(—6/a, 1) = —6^/a + c = (ac — 6^)/a > 0 e,
portanto, ac —6^ > 0.
2. Se c > 0, então Q (l, —6/c) = a —6^/c = (ac —6^)/c > 0 e, portanto,
ac —6^ > 0.
3. Se a = c = 0, então Q (l, 1) = 2 6 > 0 e Q (l, —1) —2 6 > 0, isto é,
6 > 0 e 6 < 0. Logo, 6 0 e, conseqüentemente, ac —6^ = 0.
Em todos os subcasos, a > 0, c > 0 e ac — 6^ > 0, isto é, todos os
menores principais de A são maiores ou iguais a zero.

(<=) Reciprocamente, suponha que a > 0, c > 0 e ac —6^ > 0. Nova­


mente, temos que considerar vários subcasos.

1. Se a > 0 então, completando-se 0 quadrado, temos que


ac —6^
Q(hi, /12) — CL [hl -\— h^] + hl
a J a

é maior ou igual a zero para todo (/ii, /1 2 ) E


2. Se c > 0 então, completando-se o quadrado, temos que
^2
Q{huh2) —— — h\ + c [ - h l + h2
c
404 Otimização sem restrições

é maior ou igual a zero para todo (/ii, h 2) E


3. Se a = c = 0, então ac — iP' — —P > 0. Portanto, 6 = 0 e,
conseqüentemente, Q{hi, /i2) = 0 para todo (/^i, /12) E
Em todos os subcasos, Q{hi^h 2) > 0, isto A é uma matriz positiva
semidefinida.
(d) A é negativa semidefinida se, e somente se, a < 0, c < 0 e ac —6^ > 0.
(=^) Se A é uma matriz negativa semidefinida, então Q(1,0) = a < 0,
Q (0,1) = c < 0. Vamos considerar os vários subcasos.
1. Se a < 0, então Q(—6/a, 1) = —P j a + c = {ac — P )/ a < 0 e,
portanto, ac — P > 0.
2. Se c < 0, então Q (l, —b/c) = a —P j c = {ac—P ) / c < 0 e, portanto,
ac — P > 0.
3. Se a = c = 0, então Q (l, 1) = 2 6 < 0 e Q (l, -1 ) = - 2 6 < 0, isto é,
6 < 0 e 6 > 0. Logo, 6 = 0 e, conseqüentemente, ac — P = 0.
Em todos os subcasos, a < 0, c < 0 e ac — > 0, isto é, todos os
menores principais de ordem ímpar de A são menores ou iguais a zero e
0 menor principal de ordem par de A é maior ou igual a zero.

(<^) Reciprocamente, suponha que a < 0, c < 0 e ac —6^ > 0. Vamos


considerar os vários subcasos.
1. Se a < 0 então, completando-se 0 quadrado, temos que
ac
Q(/ii, /12) — a i hl -\— h 2 j + hi
a J a
é menor ou igual a zero para todo (/zi, h 2).
2. Se c < 0 então, completando-se o quadrado, temos que

Q{hi, /12) = -- -- - h\ + c(ç^h i + h2

é menor ou igual a zero para todo (/ii, /12).


3. Se a = c = 0, então ac — P — —P > 0. Portanto, 6 = 0 e.
conseqüentemente, Q(/ii, /i2) = 0 para todo (/ii, /i2).
Em todos os subcasos, Q{h\,h 2) < 0, isto é, A é uma matriz negativa
semidefinida.
11.5 Questões de globalidade e convexidade 405

(e) A é indefinida se, e somente se, ac — lP'< 0.


(=>) Suponha, por absurdo, que A seja uma matriz indefinida e que
ac — lP‘ > 0. Então, como A não é positiva semidefinida e nem negativa
semidefinida, pelos itens (b) e (c), concluímos que a e c devem possuir
sinais contrários, isto é ac < 0. Mas então ac —tí^ < 0, uma contradição.

(<í=) Reciprocamente, suponha que ac — }p‘ < 0. Então, pelos itens (a),
(b), (c) e (d), segue-se que A não é positiva definida, não é negativa
definida, não é positiva semidefinida e nem negativa semidefinida. Logo,
A é uma matriz indefinida. .

11.5 Q uestões de globalidade e convexidade

As condições de segunda ordem (teorema (11.7)) estabelecem um critério


para decidir se um ponto crítico é um extremo local. Elas nada afirmam
sobre a globalidade do ponto crítico! No exemplo (11.8) vimos que (3, —3)
é ponto crítico da função z = f{x^y) = + 9 xy que é um ponto de
mínimo local de / , mas não é um ponto de mínimo global de / em R^.
Como garantir a globalidade de um ponto crítico? Se o conjunto ad­
missível é aberto (o caso que estamos estudando neste capítulo) o teorema
de Weierstrass não pode ser utilizado. Nesta seção vamos estudar uma classe
específica de funções para as quais é possível garantir a globalidade de pontos
críticos: funções convexas e funções côncavas. Mas antes, vamos apresentar
um teorema de globalidade de Cálculo I que não pode ser estendido para
Cálculo II.

Exercício resolvido 11.4 Diga se cada uma das sentenças a seguir é ver­
dadeira ou falsa, apresentando uma justificativa caso ela seja verdadeira ou
um contra-exemplo caso ela seja falsa.

(a) Suponha que / : R -> R seja uma função de classe que possui um
único ponto crítico p que é um ponto de mínimo local de / . Então p é
um ponto de mínimo global de / em R.
(b) Suponha que / : R^ -> R seja uma função de classe que possui um
único ponto crítico p que é um ponto de mínimo local de / . Então p é
um ponto de mínimo global de / em R^.
406 Otimização sem restrições

Solução:

(a) A sentença é verdadeira! Se p é o único ponto crítico de / , então a


derivada / ' possui um mesmo sinal em todos os pontos x maiores do
que p e um mesmo sinal em todos os pontos x menores do que p. Como,
por hipótese, p é um ponto de mínimo local de / , concluímos que / ' é
positiva em todos os pontos x maiores do que p e negativa em todos os
pontos X menores do que p. Desta maneira, / é estritamente crescente
no intervalo [p,+ 00) e estritamente decrescente no intervalo (—oo,p].
Portanto, f{x) > f{p) para todo x ^ p. Conseqüentemente, p é um
ponto de mínimo global de / em M.
- 0 +

p X
Figura 11.10: Estudo do sinal de

(b) A sentença é falsa! Como um contra-exemplo, considere a função

2; = /(x, y) = x^ + { l - xfy^

definida para todo (x, y) € Claramente / é uma função de classe


(de fato, / é uma função C°°). Os pontos críticos de / são calculados
resolvendo-se a equação

(2x - 3 ( 1 - x) V , 2 ( 1 - x)3j/) = (0,0),

isto é, resolvendo-se o sistema não-linear

2x —3 (1 — = 0,
( 11. 2)
{ 2 (1 —x)^y = 0.

Da segunda equação concluímos que p = 0 ou x = 1. Se p = 0, da


primeira equação, concluímos que x = 0. Por outro lado, se x = 1, segue-
se da primeira equação que 2 = 0, um absurdo. Assim, (0,0) é o único
ponto crítico de / em Vamos aplicar as condições de segunda ordem
para tentar classificar este ponto crítico e, para isto, vamos calcular a
matriz hessiana D ^/(x,p) de / no ponto (x,p):
11.5 Questões de globalidade e convexidade 407

iL u y ) 2 + 6(l-x)j/^ - 6 ( l - x ) ^ y

^ ( x y ) ^(xy) -6(l-x)2y 2{l-xf


dydx^^^’ dy^^
Desta maneira, fazendo {x,y) = (0,0), temos que a matriz hessiana
D^f{0,0) de / no ponto (0,0) é dada por

2 0
a = d V ( o, o) =
0 2

Como |j4i | = 2 > 0 e \A^\ = 4 > 0, segue-se que A é uma matriz


positiva definida e, conseqüentemente,'(0,0) é um ponto de mínimo local
de / . Contudo, (0,0) não é um ponto de mínimo global de / , uma
vez que /(2 ,3 ) = (2)^ + (1 ~ 2)^(3)^ = —5 < 0 = / ( 0 , 0). O gráfico
de / no paralelepípedo [—1.5,2.5] x [—3.0,2.5] x [—1.0,2.5] está indicado
na figura (11.11). i

Figura 11.11: O gráfico de 2: = f { x , y ) = -I- (1 — x)^y'^ no paralelepípedo


[-1.5,2.5] X [-3.0,2.5] x [-1.0,2.5].
408 Otimização sem restrições

Figura 11.12: As curvas de nível de z = f { x , y ) = a;^+ (l — no retângulo


[-1.5,2.5] X [-3.0,2.5] com -1.0 < z < 2.5.
11.5 Questões de globalidade e convexidade 409

C onvexidade em Cálculo I

Em Cálculo I você aprendeu a definir e identificar funções convexas e


côncavas com o uso de derivadas. Vamos dar uma definição alternativa de
convexidade que não faz uso de derivadas.

D efinição 11.6, (F unções CONVEXAS B côNpÀVAS)


(a ) ;Dizemos que uma função / : D C M —>■® è con vexa {o u .c ô n c a v a
■p a ra cim a) em um intervalo 7 C D se, e somente se,

paia todo p, g € I e todo í e [0,1]. ;


(b) Dizemos que uina função, f : D C R - t K é côn cava (ou. côn cava
p a r a baixo) em uro intervalo J C D se, e somente se,

f { { l - t ) ' - p + t - ^ ) > ( l - t ) - f ( p ) + t.'- f { q ) , (11.4)

para todo p ^ q E I e todo í € [0,1].

Vamos entender o que esta definição quer dizer geometricamente. Uma vez
escolhidos os pontos p e q no intervalo I, para cada í € [0,1], a expressão

x{t) = (1 —t) - p + í- g

representa um ponto sobre o segmento de reta que une p e g. Assim, por


exemplo, em í = 0 temos x(0) = p, em í = 1 temos x(l) = g, em t = 1/2
temos x (l/2 ) = (p + g)/2, etc. A expressão x{t) é denominada combinação
linear convexa dos pontos p e g. Da mesma maneira, para cada í € [0,1], a
expressão

s{t) = (1 - í) • /(p) + 1 • /(g)

representa um ponto sobre o segmento de reta que une /(p ) e /(g). Resu­
mindo, para cada t 6 [0,1], x{t) = (1 —í) -p-l-í •g representa um ponto sobre
o segmento de reta que une p e g.

x(í), f{x{t)) = (1 - í) • p + í • g, / ( ( l - í) • p + í • g)
410 Otimização sem restrições

representa o ponto no gráfico de f com abscissa x{t) = {1 — t) • p + t • q e

(x{t), s{t)j = ^(1 - í) • p + í • 9, (1 - í) • f{p) + t ■f{ q ) j

representa o ponto na reta secante que passa pelos pontos (p, f {p))e (g, f{q))
com abscissa x{t) = {1 — t) • p + t • q.
Portanto, dizer que uma função / é convexa em um intervalo /, isto
é, dizer que / satisfaz a expressão (11.3) para todo p,q E I e todo t E
[0,1], significa dizer que o segmento de reta secante que passa pelos pontos
(P) /(p)) ^ {Qj I Í q)) sempre está acima ou coincide com o gráfico de / (veja
a figura (11.13)).

Figura 11.13: P ara um a função convexa, o segmento de reta secante fica sem­
pre acima ou coincide com o gráfico da função, para quaisquer
escolhas de p e q.

Analogamente, dizer que uma função / é côncava em um intervalo 7,


isto é, dizer que / satisfaz a expressão (11.4) para todo p, g 6 7 e todo
t E [0,1], significa dizer que o segmento de reta secante que passa pelos
pontos (p, /(p)) e (g, /(g)) sempre está abaixo ou coincide com o gráfico de /
(veja a figura (11.14)).
Para funções de classe C^, podemos usar a primeira derivada para carac­
terizar convexidade e concavidade.
11.5 Questões de globalidade e convexidade 411

Figura 11.14: P ara um a função côncava, o segmento de reta secante fica sem­
pre abaixo ou coincide com o gráfico da função, para quaisquer
escolhas de p e q.

T eorem a 11.9 Seja / : I C uma função de classe definida


em um intervalo /,
(a) / é uma função convexa em / se, e somente se,

/(? ) > /(p ) + / '( p ) ‘ ( 9 - p ) , (11.5)

para todo p, q € / .
(b) / é uma função côncava em 1 se, e somente se,

/(« ) < / ( p ) + / '( ? ) '( 9 -í>), (11.6)

paja todo p , q € I.

Geometricamente, a expressão (11.5) diz que uma função de classe


definida em um intervalo I é convexa se, e somente se, cada reta tangente
ao gráfico de / está sempre abaixo ou coincide com o gráfico de / (veja a
figura (11.15)).
Analogamente, a expressão (11.6) diz que uma função de classe defi-
412 Otimização sem restrições

Figura 11.15: P ara um a função convexa, cada reta tangente ao gráfico de /


está sempre abaixo do gráfico de / .

nida em um intervalo I é côncava se, e somente se, cada reta tangente ao


gráfico de / está sempre acima do gráfico de / (veja a figura (11.16)).
Você pode encontrar uma demonstração do teorema (11.9) na referência [71].
Como corolário, temos o seguinte teorema de globalidade de pontos críticos.

T eo rem a 11.10 Sejam / 7 c M M ttma função de classe defi­


nida em una intervalo 7 e p e 7 rnn ponto crítico de /

(a) Se / é uma função convexa em 7, então p é ura ponto de xmmmo


global de / em 7.

(b) Se / é uma função côncava em f , éntão p é úm ponto de máadmo


global de / em 7,

Demonstração: Se f é uma função convexa em 7, pelo teorema (11.9), vale


que f{q) > f (p) -f /'(p) • (ç—p), para todo q E I. Uma vez que p é um ponto
crítico de / , segue-se que f'{p) = 0 e, portanto, f(q) > f{p) para todo q E I,
isto é, p é um ponto de mínimo global de / em 7. Analogamente, se f é uma
função côncava em 7, pelo teorema (11.9), vale que f{q) < f{p)+f'{p)-{q—p),
para todo q E I. Uma vez que p é um ponto crítico de / , segue-se f'{p) = 0
11.5 Questões de globalidade e convexidade 413

Figura 11.16: P ara um a função côncava, cada reta tangente ao gráfico de /


está sempre acima do gráfico de / .

e, portanto, f{q) < f{p) para todo q E 1^ isto é, p é um ponto de máximo


global de / em I. a

Para funções de classe podemos usar a segunda derivada para caracteri­


zar convexidade e concavidade, obtendo o famoso critério de Cálculo I.

T eorem a 11.11 S e ja /: I uma função de classe defimda


em um intervalo L
(a) / é uma função convexa em I se, e somente se, f \ p ) > 0 para

(b) / é uma fimção côncava em I se, e somente se, f \ p ) < 0 para

C onvexidade em Cálculo II

A fim de generalizarmos a definição (11.6) para funções de várias variáveis,


é necessário que o domínio destas funções tenha a seguinte propriedade
414 Otimização sem restrições

geométrica: o segmento de reta que une dois pontos quaisquer do domínio


sempre está contido no domínio. Isto motiva a próxima definição.

^ D efinição 11.7 ( C o n j u n t o s c o n v e x o s ) Dizemos que Í7 c é


. um conjfmto convexo se, e somente se, para todo p, q G Í7 tem-se
■ ipiil
{l - t)'p + t -q e u ,
para todo t € [0,1), isto é, se o segmento de reta que une dois pontos
, ^quaisquer de U está sempre contido em U.

Exem plo 11.16 Na figura (11.17), os conjuntos dos itens (a) e (b) são con­
vexos enquanto que os conjuntos dos itens (c) e (d) não são convexos. g

C U ID A D O ! CU ID A D O ! CU ID A D O !

Existem funções convexas e funções côncavas mas não existem conjuntos


côncavos! Se um conjunto não é convexo, ele é denominado não-convexo\

Com a noção de conjuntos convexos, a definição de convexidade e concavi­


dade estende-se facilmente para funções escalares de várias variáveis.

l l . f . çôncavas ) --

(á) DizeMos queuina.fun^ãó / : R definida em um subcon-


^ jünto convexo;.!!!, de ^í^,é'':çonvé®o;:sej e sómente se, .

+ + (ÍL7).

pajajtodo p, e í7 e todo 1 6 (0,1].


(b) Dizemos que uma função f : U c W ^ R definida em um subcon­
junto convexo de IR” é côncava se, e somente se,

/ ( ( i - |í ) ' P + í • q) > (1 - í) • /(P ) -\rt • /(q ), (11.8)


para.todo p, q € 17 e todo t € [0,1].
11.5 Questões de globalidade e convexidade 415

Figura 11.17: Os conjuntos dos itens (a) e (b) são convexos enquanto que os
conjuntos dos itens (c) e (d) não são convexos.

A interpretação geométrica é a mesma: dizer que uma função / é convexa


em um conjunto convexo [/, isto é, dizer que / satisfaz a expressão (11.7)
para todo p, q G ?7 e todo t € [0,1], significa dizer que o segmento de reta
secante que passa pelos pontos (p, /(p )) e (q, /(q )) sempre está acima ou
coincide com o gráfico de / (veja a figura (11.18)).
Analogamente, dizer que uma função / é côncava em um conjunto convexo /7,
isto é, dizer que / satisfaz a expressão (11.8) para todo p, q G C/ e todo
t G [0,1], nada mais quer dizer que o segmento de reta secante que passa
pelos pontos (p, / ( p ) ) e (q, / ( q ) ) sempre está abaixo do gráfico de / .
Os teoremas (11.9), (11.10) e (11.11) generalizam-se facilmente para funções
de várias variáveis.

T eorem a 11.12 Seja / Í7 C -4 K uma função de classe defi­


nida em um subconjunto convexo U de W-
416 Otimização sem restrições

Figura 11.18: P ara um a função convexa, o segmento de reta secante fica sem­
pre acima ou coincide com o gráfico da função, p ara quaisquer
escolhas de p e q.
11.5 Questões de globalidade e convexidade 417

(a) / é uma função convexa em U se, e somente se,

/( q ) > /( p ) + í? /(p )-{q -p ), (11.9)

para todo p , q € l f .
(b) / é uma função côncava em U se, e somente se,

/(q) < /(p ) + D f { p ) ■(q ~ p), (11.10)

para todo p ,q € Í7-

Como no caso unidimensional, a expressão (11.9) diz que uma função de


classe definida em um conjunto convexo U é convexa se, e somente se,
cada hiperplano tangente ao gráfico de / está sempre abaixo ou coincide com
0 gráfico de / . Analogamente, a expressão (11.10) diz que uma função de
classe definida em um conjunto convexo U é côncava se, e somente se,
cada hiperplano tangente ao gráfico de / está sempre acima ou coincide com
o gráfico de / .
Como corolário, temos o seguinte teorema de globalidade de pontos críticos.

T eorem a 11,13 Sejam f i U C M" K urda função de classe


definida era um subconjunto convexo £/ de E" e p 6 tf ura ponto

(a) Se / é uma função convexa em Í7, então p é um ponto de mínimo


global de f em U
(b) Se f é uma função côncava em U, então p é um ponto de máximo
global de / em 27.

O teorema (11.12) é muito útil para se demonstrar propriedades de funções


convexas e côncavas. Contudo, ele não é muito prático para se testar a
convexidade ou concavidade de uma dada função, isto porque ele exige que
verifiquemos uma desigualdade para todo p e q no convexo 27. De fato,
veremos que a generalização do teste da derivada segunda para funções de
uma única variável (teorema (11.11)) é mais prática para este fim.
418 Otimização sem restrições

Seja / : í / C M" - f H uma função de clásse defi- ;


irá: subconjunto convexo e aberto Í7 de I?*.

' }.l(à) tP 4 tuna função convexa em U se, e somente se, a matriz bessiana
f ê j p o s i t i v a semidefimda pom todo p E Ü .

;(b) f é uma função côncava em Í7 se, e somente se, a m atnz hessiana


- D^ f {p) é-negativa semidefimda para todo p £ 17.

E x e m p lo 1 1 .1 7 Considere a função z = f { x, y) = + x^y^ + y"^—3 x —8y


definida em . A matriz hessiana de f é dada por

1 2 x^ + 2 y^ Axy
D^f (x,y) = Axy 2 + 12

Uma vez que os dois menores principais de ordem 1 ,

12 +2 2x^ + 12y2,

e 0 menor principal de ordem 2 ,

24x'‘ + 1 3 2 x V + 24y^

de D^f{x, y) são maiores ou iguais a zero para todo (x, y) em segue-se


pelo teorema (11.14) que / é uma função convexa em ■

E x e m p lo 11.18 Considere a função z = f { x, y) = xy definida em A


matriz hessiana de / é dada por

0 1
D^f {x, y) =
1 0

Uma vez que o menor principal de ordem 2 de D'^f{x,y) é igual a —1 para


todo (x ,y ) 6 segue-se pelo teorema (11.14) que / não é uma função
convexa e nem uma função côncava em R^. i

E x e m p lo 11.19 Considere a função z = f [ x, y ) = x^ + y^^ definida em R^.


A matriz hessiana de / é dada por
11.5 Questões de globalidade e convexidade 419

12x2 0
D^f { x , y) = 0 12 y2

Uma vez que os menores principais de D'^f{x, y),

12 x^, 12 j/2 e 144

são maiores ou iguais a zero para todo (x ,y ) G segue-se pelo teo­


rema (11.14) que / é uma função convexa em R^. O único ponto crítico
de / é (0,0). Logo, pelo teorema (11.13), (0,0) é ponto de mínimo global
de / em R^. ,

CUIDADO! CUIDADO! CUIDADO!

Observe a diferença entre os teoremas (11.7) e (11.14). Se a matriz


hessiana de uma função / de classe em um ponto crítico p é positiva
definida, então p é um ponto de mínimo local de / . Mas, se a matriz
hessiana de / em um ponto crítico p é positiva semidefinida, então p
pode ser um extremo local ou um ponto de sela de / , isto é, as condições
de segunda ordem não conseguem classificar o ponto crítico neste caso.
Por outro lado, se a matriz hessiana de / é positiva semidefinida em
todos os pontos do domínio (convexo) de / , então todo ponto crítico
de / será um ponto de mínimo global de / . Por exemplo, (0, 0) é um
ponto crítico da função z = f { x, y) = x^ + A matriz hessiana de /
neste ponto.

0 0
d 2/(0,0) =
0 0
é positiva semidefinida. Com isto, caímos no caso “inconclusivo” do
teorema (11-7). Por outro lado, a matriz hessiana de / em um ponto
(x,j/) qualquer de R^,

12x2 0
£>2/ ( x ,y ) =
0 12 y2

é positiva semidefinida para todo (x,j/) G R2. Portanto, pelo teo­


rema (11.14), / é uma função convexa em R2. Sendo assim, pelo teo­
rema (11.13), 0 ponto crítico (0,0) é ponto de mínimo global de / em R2.
420 Otimização sem restrições

11.6 O m étodo dos m ínim os quadrados

Freqüentemente, quando fazemos experimentos ou observações estatísti­


cas, obtemos dados que podemos dispor em uma tabela:

X y
Xi 2/1
X2 V2 ■

Vn

Gostaríamos de descobrir se os dados obtidos podem estar relacionados de


alguma maneira. Em geral, a primeira coisa que tentamos verificar é se os
dados satisfazem a equação de uma reta. No caso particular em que a tabela
possui apenas dois pontos (com xi ^ sabemos que existe uma única
reta que passa por eles. Por exemplo, a reta que passa pelos dois pontos da
tabela

X y
1 2
5 7

é dada pela equação

3 5
^ = 74 + 7^-
4

Contudo, se a tabela possui três ou mais pontos, seria muita sorte que todos
estes pontos estivessem alinhados sob uma mesma reta. Neste caso, gos­
taríamos de encontrar uma reta que aproximasse estes pontos, em algum
sentido. Considere a figura (11.19). Para qualquer reta j/ = ax + ò, podemos
medir a distância vertical de cada um destes n pontos até a reta. Estas
distâncias estão representadas pelos comprimentos dos segmentos verticais
pontilhados di, d2 e d^ na figura. E fácil de ver que

dl = \axi + b - yil, ^2 = \ax2 + b - 3/2I, dji — axj + b — yji\.

Desta maneira, poderíamos nos perguntar qual a melhor reta ou, em outras
palavras, quais os melhores valores dos coeficientes a e 6, a fim de minimizar
11.6 o método dos mínimos quadrados 421

Figura 11.19: A distância vertical agregada entre os três pontos ( x i, 2/i),


(2:2, Vi), {X3, yz) e a reta y = ax + h.
422 Otimização sem restrições

a soma dos quadrados dos desvios:

s(a, 6) = + CÍ2 “I" ***


= (0x 1 + 6 - y { f + [ax2 + b - + + {aXn + h - y n f
n
= 'Y^{axi + h - y i f .
2=1

Você poderia se perguntar por que estamos querendo minimizar a soma dos
quadrados dos desvios ao invés de, mais simplesmente, minimizar a soma dos
desvios? Uma boa razão é que a função módulo | | não é derivável na origem
e estamos querendo usar derivadas para resolver este problema! Observe que

s:

{a,b) i-> s{a,b) = ^^ {axi + b - yiY


2=1

é uma função de duas variáveis de classe definida para todo (a, 6) G


Como é um conjunto aberto, se s possui um mínimo global (a*, b*) em R^,
então, pela regra de Fermat, Vs(a*,6*) = (0,0), isto é, (a*, 6*) é um ponto
crítico de s. Vamos então calcular os pontos críticos de s. Uma vez que

2=1 2= 1

^ 2 {axi + b - yi)xi = 2 Í ^ x - | a + 2 Í ^ X j | 6 - 2 Í ^ xiyi


2=1 \i= i / \i= i / \i= i y

e, analogamente,

db
. 2=1 2=1

'^2{axi + b - y i ) l = 2 Í ^ X i j a + 2 j ^ l j 6 - 2 Í J ] ^ y i j ,
2=1 \2 =1 / \2=1 / \2 =1 /

segue-se que (a, ò) é ponto crítico de s se, somente se, (a, 6) é solução do
11.6 o método dos mínimos quadrados 423

seguinte sistema linear

a + 6 = ^ XiVu
s,i=l ,i=l 2= 1
( 11. 11)
^n
a + n b = ' ^ Vi,
^2=1 2=1

nas variáveis aeb. Resolver este sistema não é difícil e fica como um exercício
mostrar que a única solução deste sistema linear é dada por

n
a = 2=1 i=l / \i= l
— 7"::;— r r -
nE * ?-
2=1 , 2= 1

_ \2=1 / \2=1 / \2=1 / \í=l >

n E - .^ - E^
2=1 , 2=1

Resta mostrar que, de fato, este ponto crítico é ponto de mínimo global
de 5 em R^. Para isto, basta demonstrar que s é uma função convexa em R^
pois, pelo teorema (11.13), todo ponto crítico de uma função convexa de
classe é ponto de mínimo global da função.
Para mostrar que s é convexa em R^ vamos demonstrar que a matriz
hessiana
n n

2 E
2=1 i=l
D^5(a, b) = TL

2 2n
2=1

de 5 é positiva semidefinida para todo (a, ò) E R^. Os menores principais da


424 Otimização sem restrições

matriz hessiana b) são dados, respectivamente, por

2 ^ a;?, 2n e 4 j n ^ x? -
i=i y i=i \i= i /

Claramente, 2 x? > 0 e 2 n > 0 e, se provarmos que a desigualdade

n / ^ \ ^
n 2:? — í Xf I = n{x l + '' • + —(xi + • • • + > 0
i=l , 2=1

vale para todo xi, X2, . . . , € R, então teremos provado que todos os me­
nores principais de Z?^5(a, ò) são maiores ou iguais a zero. Com isto, pelo
teorema (11.14), 5 é uma função convexa em R^. Para provar a desigualdade
acima, vamos usar a relação fundamental

2 XiXj < X? + x^, com Xi, xj G R,

que pode ser demonstrada da seguinte maneira:

{xi — XjY > 0 xl — 2 XiXj + Xj > 0 2 XiXj < x] + x^.

Agora para todo xi, X2, . . . , X;^ G R vale que

(xi H-------h XnY = x\-\------ Vxl^ + 2 X1X2 + 2 X1X3 H------ h 2 xix„


+ 2 X2X3 + • • • + 2 X2X71

"P 2 Xji—\Xji.

Mas, pela relação fundamental, temos que


.2
2 X1X2 < 3^1 + x\, 2 X1X3 < x \ + X3,
35 . . . , 2 X\ Xj i ^ X | H” ^77,5

2 X2X3 < X2 + .235X3, 2X 2X ^ < x^ + x ^ .

2 Xfi—i Xfi ^ ^ n —l ^n*

para todo xi, X2, . . . , x„ G R. Com estas desigualdades, segue-se que


11.6 o método dos mínimos quadrados 425

(®i H------- h < xf H------- h + ( i j + Xa) + (x í + x |) H------- 1- (xj + x^)


+ (x| + xl) + - - - + (x? + x;>

+ (^ L i + 4 ) .

isto é

(xi + • *• + Xfi)^ ^ + ' + xl + { n - l ) { x l + --. + xl) = n{xl + ... + xl).

Exem plo 11.20 Para encontrar a reta que ‘‘melhor” aproxima os pontos

(0,4), (3,3), (4,2), (3,1) e (5,0),

pelo método dos mínimos quadrados, construímos a tabela

i Xi Vi ^iVi 4
1 0 4 0 0
2 3 3 9 9
3 4 2 8 16
4 3 1 3 9
5 5 0 0 25
E 15 10 20 59

Portanto, usando as fórmulas para a* e b*,

5 • 20 - 15 • 10 5 59 • 10 - 15 • 20 _ 29
á* = b* =
5 • 59 - 15 • 15 7 5 • 49 - 15 • 15 ~ Y ’

concluímos que a equação da reta que “melhor” aproxima estes pontos é


dada por

5 29
V
y 7X^-I------
= ---- 7 ou 5 X -|- 7 —29.

A figura (11.20) mostra o gráfico da reta y = —5 x / 7 + 29/7 junto com o


desenho dos 5 pontos (0,4), (3,3), (4,2), (3,1) e (5,0) originais. ^
426 Otimização sem restrições

0 método desenvolvido nesta seção é conhecido como método dos mínimos


quadrados ou regressão linear. A idéia básica pode ser generalizada para
equações de curvas mais complicadas do que retas. Por exemplo, poderíamos
nos perguntar qual é a melhor parábola que aproxima um conjunto de pon­
tos do plano. Esta idéias também contribuíram para o desenvolvimento da
ciência cibernética de Norbert Wiener.

F igura 11.20: Regressão linear dos pontos (0,4), (3,3), (4,2), (3,1) e (5,0).

11.7 Exercícios

[01] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Sejam f : W —)►M uma função de classe e D um subconjunto


não-vazio de R” . Se / não possui pontos críticos em D, então / não
possui extremos locais em D.
(b) Sejam / : R^ R uma função de classe e D um subconjunto
aberto e não-vazio de R^. Se / não possui pontos críticos em D,
então / não possui extremos locais em D.
11.7 Exercícios 427

(c) Sejam / : -> R uma função de classe e D um subconjunto


não-vazio de R^. Se / não possui pontos críticos em D, então / não
possui extremos globais em D.
(d) Sejam / : R^ -> R uma função de classe e D um subconjunto
aberto e não-vazio de R^. Se / não possui pontos críticos em D,
então / não possui extremos globais em D.
[02] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) A função /(x , y, z) = 3 • y + cos(x^ 4- - sen(x^ —z^) não possui
extremos locais em R^.
(b) A função /(x , z) = 3 • y + cos(x^ + —sen(x^ — não possui
extremos locais no conjunto {(x, y, G R^ | x^ + y^ + 2;^ = l}.
(c) A função /(x , y, z) = 3 • y + cos(x^ + —sen(x^ —z'^) não possui
extremos globais em R^.
(d) A função /(x , y,z) = 3 • y + cos(x^ -h z^) —sen(x^ —z^) não possui
extremos globais no conjunto {(x, y, z) G R^ | x^ + y^ + 2:^ = l}.
[03] (a) Mostre que a função /(x , y, z) = cos(ln(x^ + y^ + 2xy + 4)) + 5z não
possui extremos locais em R^.
(b) Mostre que a função /(x , y, z) = cos(ln(x^ + + 2xy + 4)) + 5z não
possui extremos globais em R^.
[04] (a) Mostre que (1,1) não é ponto de extremo global da função /(x , y) =
2 (x^ + y^) definida em R^.
(b) Mostre que (1,1) não é ponto de extremo local da função /(x , y) =
2 (x^ + 2/^) definida em R^.
[05] Considere o problema da dieta (página 26) onde queremos minimizar

C(xi,X2,X3,X4,X5,X6,X7,X8,Xg) = 0.60 • Xi + 1.00 • X2+


5.00 • X3 + 1.00 • X4+
0.50 • X5 0.20 • Xg-j"
0.15 • X7 + 0.40 • X8+
1 . 0 0 • Xg

com (xi, X2 , X3 , X4 , X 5 , X 6 j X 7 , X8) no conjunto admissível D formado pelos


pontos de R^ que satisfazem as restrições
428 Otimização sem restrições

f 0 .1 4 0 • x i + 0 .5 8 0 • X 2 + 0 .1 5 0 • X3 +
26.790 • X5 + 0.035 • xe > 3,
0.08 • xi + 1.30 • X3 + 0.08 • X4 + 0.07 • 2:5+
0 .0 5 • xq -f- 0 .0 4 • Xy 0 .0 8 • xq -f* 0 .0 7 * xg ^ 1*1)

26 • X3 + 38 • X4 + 13 • X3 + x^-\-
5 • X7 + 8 • xs + 25 • Xg > 60,
1.60 • xi + 6.90 • X3 + 0.20 • X4 + 0.07 • X5+
0.02 • X7 + 0.10-X8 + 2.00-Xg > 11,

xi > 0, X2 > 0, X3 > 0, X4 > 0,


^ X5 > 0 , Xe > 0 , X7 > 0 , X8 > 0 e xg > 0 .

Resolva as questões a seguir, não esquecendo de justificar cuidadosa­


mente sua resposta.
(a) O ponto (1,1,1,1,1,1,1,1,1) pertence ao conjunto admissível Dl
(b) O ponto (1,1,1,1,1,1,1,1,2) pertence ao conjunto admissível Dl
(c) O conjunto admissível D é vazio?
(d) O ponto (1,1,1,1,1,1,1,1, 2) é um ponto interior do conjunto ad­
missível D l
(e) O ponto (1,1,1,1,1,1,1,1,2) é um extremo global da função C no
conjunto admissível Dl
(f) O ponto (1,1,1,1,1,1,1,1,2) é um extremo local da função C no
conjunto admissível Dl
(g) Mostre que C não possui extremos globais no interior do conjunto
admissível D.
(h) Mostre que C não possui extremos locais no interior do conjunto
admissível D.
(i) Encontre um ponto da fronteira do conjunto admissível D.
[06] Na figura (11.21) encontram-se as curvas de nível de uma função escalar
/ de classe definida em Os únicos pontos críticos de / são
os pontos p, q e r. Os vetores indicam a direção e sentido do vetor
gradiente.
(a) O ponto p é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
11.7 Exercícios 429

Figura 11.21: As curvas de nível de um a função / : ^ de classe

(b) O ponto q é máximo local, mínimo local ou ponto de sela para a


função /? Justifique sua resposta.
(c) O ponto r é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
(d) O ponto s é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua reposta.

[07] Na figura (11.22) encontram-se as curvas de nível de uma função escalar


/ de classe definida em Os únicos pontos críticos de / são
os pontos p, q e r. Os vetores indicam a direção e sentido do vetor
gradiente.

(a) O ponto p é máximo local, mínimo local ou ponto de sela para a


função /? Justifique sua resposta.
(b) O ponto q é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
(c) O ponto r é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
(d) O ponto s é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua reposta.

[08] Na figura (11.23) encontram-se as curvas de nível de uma função escalar


/ de classe definida em Os únicos pontos críticos de / são
os pontos p, q e r. Os vetores indicam a direção e sentido do vetor
gradiente.
430 Otimização sem restrições

Figura 11.23: As curvas de nível de uma função / : —)• R de classe


11.7 Exercícios 431

(a) O ponto p é máximo local, mínimo local ou ponto de sela para a


função /? Justifique sua resposta.
(b) O ponto q é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
(c) O ponto r é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua resposta.
(d) O ponto s é máximo local, mínimo local ou ponto de sela para a
função /? Justifique sua reposta.

[09] Aproxime f [x) ~ em a = 0 com um polinómio de Taylor de grau três


e com um polinómio de grau quatro. A seguir, calcule os valores destas
aproximações em x = 0.2 e a: == 1.0 e compare com os valores corretos.

[10] Use o polinómio de Taylor de ordem dois de f{x) = no ponto a = 4


para obter uma aproximação de (4.2)^/^.

[11] Calcule os polinómios de Taylor de ordem um, dois e três da funções


y = f{x) = y/x + 1 em a = 0 e da função y = ^(a:) = ln(a:) em x = 1.
A seguir, calcule os valores destas aproximações em a: = 0 .2 e x = 1.0e
compare com os valores corretos.

[12] Calcule os polinómios de Taylor de ordem um e dois das funções abaixo


nos pontos indicados.

(a) f{x, y) = x / { l + y) em p = (0,0).


(b) /(x , y) = + em p = (0, 0).
(c) /(x ,y , z) = em p = (1, 1, 1).
(d) /(x , y) = k x V em p = (1, 1).

[13] Use o polinómio de Taylor de ordem dois em p = (1,1) para aproximar


/(x , y) = em q = (1.2,0.9).

[14] Escreva o polinómio de Taylor de ordem dois da função de duas variáveis


/(x , y) = é^/{y + 1) no ponto p = (0, 1).

[15] Sejap(x, y) = uo+ai x +02 y+5i x^+62 xy-\-hz y^ um polinómio de ordem


dois de duas variáveis. Para qualquer (x*,y*), mostre que 0 polinómio
de Taylor de / de ordem 2 no ponto (x*, y*) é 0 próprio polinómio p.
432 Otimização sem restrições

[16] Considere a matriz

2 -1
A=
-1 1

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q(hi, /i2) associada
à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando o
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e
Q(q) < 0.

[17] Considere a matriz

-3 4
A=
4 -5

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q{h\, /12) associada
à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando 0
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que <5(p) > 0 e
<3(q) < 0.
11.7 Exercícios 433

[18] Considere a matriz

-3 4
A=
4 -6

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q(hi, /i2) associada
à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando o
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e
Q(q) < 0.

[19] Considere a matriz

2 4
A=
4 8

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q{hi, /i2) associada
à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando o
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que <5(p) > 0 e
Q(q) < 0.
434 Otimização sem restrições

[20] Considere a matriz

1 2 0
A = 2 4 5
0 5 6

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q(hi, / 12 , / 13 ) asso­
ciada à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando 0
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e
Q(q) < 0.
[21] Considere a matriz

-1 01
A = 1-1 0
0 0-2

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q(hi, h2, hs, h4)
associada à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando 0
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
11.7 Exercícios 435

(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e


Q(q) < 0.

[22] Considere a matriz

3 -2
A = -2 3
0 0

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q{h\, hz) asso­
ciada à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando o
método de Lagrange.
(d) Calcule todos os menores principais de A.
(e) Calcule todos os menores principais líderes de A.
(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e
Q(q) < 0.
[23] Considere a matriz

10 3 0
0 2 0 5
A=
3 0 4 0
0 5 0 6

(a) A matriz A é simétrica? Justifique sua resposta.


(b) Escreva explicitamente a forma quadrática Q = Q{h\, hz, /14)
associada à matriz A.
(c) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando 0
método de Lagrange.
(d) Calcule todos os menores principais de A.
436 Otimização sem restrições

(e) Calcule todos os menores principais líderes de A.


(f) Classifique a forma quadrática (positiva definida, negativa definida,
indefinida, positiva semidefinida, negativa semidefinida) usando os
menores principais de A.
(g) Encontre, caso existam, pontos p e q em tais que Q(p) > 0 e
Q(q) < 0.

[24] Seja A uma matriz simétrica 4 x 4 . Denote o menor principal líder de


ordem k A por \Ak\. Classifique a matriz A como positiva definida,
negativa definida, indefinida, positiva semidefinida e negativa semide­
finida em cada um dos casos abaixo. Justifique cuidadosamente sua
resposta.
j1 >
(a) | ^ i l > 0, IA2I 0, IA3I> 0 e IA4I> 0.
(b) |A i |< 0, IA2I
2I < 0, 1^1 < 0 e IA4I< 0.
(c) l^il < 0, IA2I > 0, l^al < 0 e IA4I > 0.
(d) |A i |> 0, IA2I
2I > 0) l^al > 0 e IA4I< 0.
(e) \Ai\ = 0, IA2I
2I < 0, \A^\ = 0 e lA^l = 0.
[25] Verdadeira ou falsa? Se ^ 5x5 é uma matriz simétrica com \Ai\ > 0,
IA2I > 0, \A^\ > 0, IA4I = 0 e l^sl = 0, então A é positiva semidefi­
nida. Apresente uma justificativa caso a sentença seja verdadeira ou um
contra-exemplo caso ela seja falsa. Aqui \Ak\ denota o menor principal
líder de ordem k de A.
[26] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se A é uma matriz simétrica n x n positiva definida, então B = —A
é uma matriz simétrica negativa definida.
(b) Se A é uma matriz simétrica n x n negativa definida, então B = —A
é uma matriz simétrica positiva definida.
[27] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) Se A é uma matriz simétrica n x n com todos os seus elementos
positivos, então A é positiva definida.
11.7 Exercícios 437

(b) Se A é uma matriz simétrica n x n positiva definida, então todos os


seus elementos são positivos.
(c) Se A é uma matriz simétrica n x n positiva definida, então o maior
elemento da matriz aparece na diagonal principal.
(d) Se A é uma matriz simétrica n x n cujo maior elemento da ma­
triz aparece na diagonal principal, então A é uma matriz positiva
definida.
(e) Se A é uma matriz simétrica n x n positiva definida, então todos os
elementos da diagonal principal de A são positivos.
(f) Se A é uma matriz simétrica n x cujos elementos da diagonal
principal são todos positivos, então A é positiva definida.

[28] Verdadeira ou falsa? A matriz

1 1 1 2 9
18 1 1 1
A= 1 1 2 11
2 1 1 8 1
9 1 1 1 1

não é positiva definida. Apresente uma justificativa caso a sentença seja


verdadeira ou um contra-exemplo caso ela seja falsa.

[29] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Se A é uma matriz simétrica n x n e o determinante de A é menor


do que zero, então A não é uma matriz positiva definida.
(b) Se A é uma matriz simétrica n x n e o determinante de A é menor
do que zero, então A não é uma matriz negativa definida.

[30] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Se A é uma matriz simétrica positiva definida, então todos os me­


nores principais de A são maiores ou iguais a zero.
438 Otimização sem restrições

(b) Se A é uma matriz simétrica negativa definida, então todos os me­


nores principais de ordem ímpar de A são menores ou iguais a zero
e todos os menores principais de ordem par de A são maiores ou
iguais a zero.
*[31] Imite os cálculos feitos no exemplo (11.15) para demonstrar que uma
matriz simétrica 3 x 3 é positiva definida se, e somente se, \Ai\ > 0.
1^ 2! > 0 e \A^\ > 0 e é negativa definida se, e somente se, \Ai\ < 0.
1^ 2! > 0 e IA3I < 0. Dica: complete o quadrado duas vezes para obter
aii ai2 Ui3
\A2
[ hl h2 hs ] ai2 U22 ^23 h2 = |A |r2 + 5^+144 í'
1^21
ÍI13 ^23 ÍÍ33 . ^3 .
onde
, , “12 . , “13 , , , “ l l “ 23 ~ “ 12“ 13 ,
r —/ii H-----/i2 H------/13 , t= h
“ 11 “ 11 *= + -------\Ml-------'•’
*[32] (Forma quadrática de uma matriz quadrada qualquer) Quase
toda função usada neste curso é de classe C°°. Desta maneira, pelo teo­
rema de Young (página 176), a matriz hessiana desta função é simétrica
e isto justifica porque temos dado tanta atenção a formas quadráticas
definidas por matrizes simétricas. Mas o que dizer de formas quadráticas
definidas por matrizes não-simétricas? Os exercícios seguintes têm por
objetivo esclarecer estes pontos.
(a) Mostre que as formas quadráticas definidas pelas matrizes
1 0 1
A = B =
0 -1 -5
são iguais, isto é, mostre que
QA(h) = h ^ A h = h ^ B h = Qsih)
para todo h 6 Moral da história; duas matrizes diferentes
podem induzir à mesma forma quadrática.
(b) Por outro lado, mostre que se A e B são matrizes simétricas dife­
rentes, então suas formas quadráticas são diferentes.
(c) Dizemos que uma matriz A é anti-simétrica se ela satisfaz a pro­
priedade A^ = —A. Dê um exemplo de uma matriz anti-simétrica,
um exemplo de uma matriz que não é anti-simétrica e um exemplo
de uma matriz que não é anti-simétrica e nem simétrica.
11.7 Exercícios 439

(d) Calcule a forma quadrática definida pela matriz anti-simétrica que


você forneceu no item anterior.
(e) Mostre que a forma quadrática definida por uma matriz anti-si­
métrica é a função nula, isto é, mostre que se = —A, então
Q (h) = • A • h = 0 para todo h G
(f) Seja A uma matriz n x n qualquer. Mostre que as matrizes
A-t-A^ A -A ^
Y =
2 ' ■ 2
são, respectivamente, simétrica e anti-simétrica. Mostre também
que

A = X -f y.

Moral da história: toda matriz quadrada pode ser escrita como a


soma de uma matriz simétrica e uma matriz anti-simétrica. A ma­
triz X é denominada de parte simétrica de A e a matriz Y de parte
anti-simétrica de A.
(g) Mostre que se A é uma matriz anti-simétrica e simétrica ao mesmo
tempo, então A é a matriz nula.
(h) Mostre que a decomposição de uma matriz quadrada (como a soma
de uma matriz simétrica e uma matriz simétrica) é única, isto é,
mostre que se

A= A = X2 + F2,

onde X \ e X 2 são matrizes simétricas e Yí e y2 são matrizes anti-


simétricas, então

= X2 e Fi = y2.

(i) Conclua que para estudar a positividade de uma forma quadrática


definida, por uma matriz quadrada qualquer, basta estudar a posi­
tividade da forma quadrática definida por sua parte simétrica.

[33] No teorema de classificação de formas quadráticas via menores princi­


pais (teorema (11.8)) é fundamental que a matriz A seja simétrica). Para
você se convencer deste fato, dê um exemplo de uma matriz quadrada A
indefinida com todos os menores principais líderes maiores do que zero.
440 Otimização sem restrições

*[34] Encontre uma matriz A com 4 linhas e 4 colunas tal que a forma
quadrática definida por A seja igual a

Q(hij ^3) ^4) — “ 2 h \ h 2 + 2 /11/13 —2 /11/14+

/l 2 ^ “ 2 /l 2/^3 + 2 /l2/i4 + ^ 3 ^ ~ 2 / 13/14 + /l 4 ^.

[35] Seja A uma matriz n x n. Quantos menores principais de ordem k < n


de A existem?

* [36] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Se A é uma matriz simétrica positiva definida, então toda submatriz


principal de A é positiva definida.
(b) Se A é uma matriz simétrica negativa definida, então toda submatriz
principal de A é negativa definida.
(c) Se A é uma matriz simétrica positiva definida, então todos os me­
nores principais de A são maiores do que zero.
(d) S e A é uma matriz simétrica negativa definida, então todos os meno­
res principais de ordem ímpar de A são menores do que zero e todos
os menores principais de ordem par de A são maiores do que zero.

[37] Considere as matrizes

a 6 0 0
6 c 0 0 a b d e
A = B = C=
0 0 d e b c e /
0 0 e /

Diga se cada uma das seguintes sentenças abaixo é verdadeira ou falsa,


apresentando uma justificativa caso ela seja verdadeira ou um contra-
exemplo caso ela seja falsa.

(a) Se A é indefinida, então B é indefinida.


(b) Se S e C são positivas definidas, então A é positiva definida.
(c) Se B é negativa definida e C é positiva definida, então A é negativa
definida.
11.7 Exercícios 441

(d) Se B é negativa definida e C é indefinida, então A não é negativa


definida.
Dica: escreva explicitamente as formas quadráticas associadas às ma­
trizes Aj B e C.
[38] Para cada uma das funções abaixo, definidas em encontre os pontos
críticos e classifique-os como mínimo local, máximo local, ponto de sela
ou “inconclusivo” .
(a) /(x , y) = xy"^ + x^y - xy.
(b) f{x, y) = - 6 xy + 2 + 10 X + 2 j/ - 5.
(c) /(x , y) = x'^ + x^ - 6 xy + 3 y^.
(d) /(x , y) = 3 x^ + 3 x^y - y^.
[39] Para cada uma das funções abaixo, definidas em encontre os pontos
críticos e classifique-os como mínimo local, máximo local, ponto de sela
ou “inconclusivo” .
(a) /(x , y, 2) = x^ + 6 xy + y^ - 3 yz -h 4 -t- 6 X -h 17 y - 2 z.
(b) /(x , y, z) = (x^ -I- 2 y^ -I- 3 z^)
[40] Mostre que

3 x4 - 4 x3 - 1 2 x2-H18
^ = /(a;, y) =
12 (l + 4y2)

possui exatamente um máximo local, exatamente um mínimo local e


exatamente um ponto de sela.
[41] Encontre os extremos locais, caso existam, para cada uma das funções
abaixo.
(a) /(x , y) = ln(x2 -h y^ 4-1).
(b) /(x , y) = x®y -h xy® -h xy.
(c) /(x , y) = (x2 - y2 - 1 ) / (x2 -|- y^ -|-1)2.
(d) /(x , y) = xy/(x^ -h y^ + 1)^.
(e) /(x , y) = 2 X®-Hy^ - 3 x2 - 3 y.
(f) /(x ,y ) = 3xy^-h X®- 3x.
(g) /(x ,y ) = x y ( l - x 2 - y 2 ) .
442 Otimização sem restrições

[42] Seja w = f{x, y, z) = x‘^ + x'^z + y'^ + — + xy.

(a) Encontre todos os pontos críticos de / .


(b) Classifique todos os pontos críticos de / como máximo local, mínimo
local ou ponto de sela.
[43] Considere a função

/(x, y) - - y ‘^ - + 2y^Ve^"+"ê^

definida para todo (x, y) G


(a) Mostre que / possui um único ponto crítico que é ponto de mínimo
local de / .
(b) Mostre que / não possui mínimos globais.

Este exercício fornece um outro exemplo de uma função de classe


que possui um único ponto crítico, que é mínimo local mas não é míni­
mo global. Compare com a função do exercício resolvido (11.4).
[44] Considere a função

/(x , y) = 3 xe^ —

definida para todo (x, y) G


(a) Mostre que / possui um único ponto crítico que é ponto de mínimo
local de / .
(b) Mostre que / não possui mínimos globais.
Este exercício fornece um outro exemplo de uma função de classe
que possui um único ponto crítico, que é mínimo local mas não é míni­
mo global. Compare com a função do exercício resolvido (11.4).
[45] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Se p é um ponto crítico de uma função / : R” R de classe ea


matriz hessiana D^/(p) no ponto p é positiva semidefinida, então
p é um mínimo local de / .
11.7 Exercícios 443

(b) Se p é um ponto crítico de uma função / : —)►R de classe ea


matriz hessiana D‘^ f{p) no ponto p é negativa semidefinida, então
p é um máximo local de /.
[46] Suponha que 2: = f{x^y) possua derivadas parciais de primeira e se­
gunda ordem contínuas para todo {x,y) G R^ e que / seja harmônica:

para todo {x^ y) G

Assuma também que (9^//9x^)(a;o, yo) / 0. Mostre que / não pode


possuir um máximo ou um mínimo local em (xq, yo)-
[47] Mostre que para qualquer escolha de números reais x, y e z, vale que

— + 4 xy —2 xz —5 y^ + 6 yz —3 < 0.

Justifique cuidadosamente sua resposta,

[48] Encontre os extremos globais, caso existam, das funções abaixo definidas
em R^. Justifique cuidadosamente sua resposta.
(a) f{x, y) = xy"^ + x^y - xy.
(b) /(a;, y) = - 6 a:?/ + 2 + 10 X + 2 y - 5.
(c) /(x , y) = x"* + 2 X V + y^-
(d) /(x , y) = 3 x^ + 3 x^y - y^.

[49] Encontre os extremos globais, caso existam, das funções abaixo definidas
em Justifique cuidadosamente sua resposta.

(a) /(x , y, z) = x^ + 6 xy + y^ - 3 yz + 4 + 6 X + 17 y - 2 z.
(b) /(x , y, z) = (x^ + 2 y^ + 3 z^)
[50] Quais dos conjuntos abaixo é convexo?
(a) {(x,y) € X > 0, y > 0 e x^ + y'^ < l}.
(b) {{x,y) G X > 0 e y > 0}.
(c) {(x,y) 6 2 ^ > 0 ií/> 0 e 2 ; + y = l}.
(d) {(x,y) e x^ + y^ < 1}.
(e) {(x,y) G x^ + y^ < 1}.
444 Otimização sem restrições

(f) { (x ,y )€ R 2 x'^ + y'^ = 1}.


(g) {{x,y,z) e X > 0,y > Q,z > 0 e X + y + z < 1}.
(h) {(x,y,z) € x '> 0 ,y> 0 ez< x'^ +
(i) {{x,y,z) e 2; > 0, y > 0, z > 0, X < 1, y < 1 e z < 1}.
[51] Mostre, usando a definição (11.7), que o conjunto

{(x, y, z, u;) G R"* I 0 < X < 1,0 < y < 1,0 < z < 1,0 < u; < 1}

é convexo.
[52] Diga se cada uma das funções abaixo é convexa, côncava ou nem convexa
e nem côncava.
(a) /(x , y) = ln(a:^ + y^ + 1), com x ,y e R .
(b) /(x , y) = x^y -f xy^ + xy, com x, y € M.
(c) /(x , y) = (x^ - y ^ - + y^ + 1)^, com x, j/ e R.
(d) /(x , y) = xy/{x^ + + l)^ com x ,y e R .
(e) /(x , 2/) = 2 x^ + - 3 x^ - 3 y, com x, y 6 R.
(f) /(x ,y ) = 3xy^ + x^ - 3x, com x^y £ R.
[53] Diga se cada uma das funções abaixo é convexa, côncava ou nem convexa
e nem côncava.
(a) /(x ) = 3 + 5 x^ —ln(x), com x > 0.
(b) /(a:,y) = —3x^ + 2xy —y^ + 3x —4y —1, com x,y E R.
(c) /(x , y, z) = 3 + 5 y"^ —ln(z), com x, yE R e z > 0.
(d) /(x , y, z) = A x^y^z^, com a, ò, c > 0 e x, y, z > 0.
[54] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
(a) A união de dois conjuntos convexos é um conjunto convexo.
(b) A interseção de dois conjuntos convexos é um conjunto convexo.
[55] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma justificativa caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
11.7 Exercícios 445

(a) Se / : [/ C —> M definida em um conjunto convexo U é convexa,


então / possui pelo menos um ponto de mínimo global em U.
(b) Se / : Í7 C M definida em um conjunto convexo U é convexa,
então / possui no máximo um ponto de mínimo global em U.
(c) Se / : C/ C M definida em um conjunto convexo U não é
convexa, então / não possui pontos de mínimo global em U.
(d) Se / : U C W ' —> R definida em um conjunto convexo U não possui
pontos de mínimo global em [/, então / não é convexa em U.
{e) Se f : U C R^ -> R definida em um conjunto convexo U possui
pelo menos um ponto de máximo global, então / não é uma função
convexa em U.
(í) Se f : U c R ” - ^ R definida em um conjunto convexo U possui
pelo menos um ponto de mínimo global, então / não é uma função
côncava em U.
(g) Se / : [/ C R^ R definida em um conjunto convexo U possui
pelo menos um ponto de mínimo global e pelo menos um ponto de
máximo global em i7, então / não é uma função convexa e nem uma
função côncava em U.
(h) Se f : U C R^ R definida em um conjunto convexo U possui pelo
menos um ponto de sela em [/, isto é, se / possui um ponto crítico
em U que não é máximo local e nem mínimo local de / em 17, então
/ não é uma função convexa e nem uma função côncava em U.
[56] Seja / : dada por

'iP'
Z = f{ x ,y ) = - + ~.

(a) Mostre que / é uma função convexa.


(b) Faça um desenho do subnwel
{{x,y) € I f{ x ,y ) < 1}
de / associado ao nível z = 1. Mostre que este conjunto é convexo.
(c) Mostre que, de fato, qualquer subnwel
{(x,y) e I f ( x , y ) < c}
de / é um conjunto convexo.
446 Otimização sem restrições

[57] Mostre que se / : C M é uma função convexa definida em um


subconjunto convexo U de R” , então o submvel

{x e Í7 I /(x ) < c}

de / , associado ao nível z = c, é um conjunto convexo para cada c € R.


[58] S e ja /: R dada por
1
2 = f{x,y) = 1 + + y2 +

(a) Mostre que / não é uma função convexa.


(b) Faça um desenho do subnível
{{x,y) e R^ I f{ x ,y ) < 1}
de / associado ao nível z = 1. Mostre que este conjunto é convexo.
(c) Mostre que, de fato, qualquer submvel
{{x,y) e R^ I f{ x ,y ) < c}
de f é um conjunto convexo.

Este exercício fornece um contra-exemplo para a recíproca da proposição


estabelecida no exercício (57) acima.
Moral da história: se f é uma função convexa, então todos os seus
subníveis são conjuntos convexos. Por outro lado, existem funções não-
convexas com todos os seus subníveis convexos.
[59] (a) Mostre que um subconjunto Í7 de R^ é convexo se, e somente se,
para todo p, q € Í7 tem-se
a i • p -f 0^2 • q G [/,
para todo ai, a 2 > 0 com + 0^2 = 1.
(b) Mostre que um subconjunto i7 de R^ é convexo se, e somente se,
para todo p, q G Í7 tem-se
^1 *P + ' **+ Qfn*q ^ Uj
para todo a i , . . . , > 0 com a i -f • • • -f = 1.
[60] Seja / : Í7 C R^ — R uma função definida em um conjunto convexo U
de R” . Mostre que / é convexa em U se, e somente se, —/ é côncava
em U.
11.7 Exercícios 447

[61] Seja a um vetor em W .


(a) Mostre que z = /(x ) = a • x é uma função convexa em
(b) Mostre que o semi-espaço
{x G R^ I a • X < c}
é um conjunto convexo, para todo c G R.

[62] (a) Mostre que 2: = /(x ) = ||x|| = i/x • x é uma função convexa em R^.
(b) Mostre que a bola fechada
{x G R^ I ||2;|| < c}
é um conjunto convexo, para todo c G R.

[63] (Funções e strita m e n te convexas e questões de unicidade) Di­


zemos que uma função f : U C R’^ — R definida em um conjunto
convexo ?7 de R^ é estritamente convexa se

/ ( ( l - í) • p + í • q) < (1 - í) • /(p ) + t • /(q ),

para todo p ,q G !7 e todo t G (0,1). Mostre que uma função estrita­


mente convexa não pode possuir dois pontos de mínimo global diferen­
tes.
[64] (Funções e strita m e n te côncavas e questões de unicidade) Di­
zemos que uma função f : U C -> definida em um conjunto
convexo U de W é estritamente côncava se

/ ( ( l - í) • p + í • q) > (1 - í) • /(p ) + t • /(q ),

para todo p, q e Í7 e todo t G (0,1). Mostre que uma função estrita­


mente côncava não pode possuir dois pontos de máximo global diferen­
tes.
*[65] Verdadeira ou falsa? Seja U um subconjunto de com a seguinte
propriedade: para todo p e q em U, o ponto

p+q 1 ,1
— = 2>’+ § " ‘
também está em U. Então U é um subconjunto convexo de Justi-
fique sua resposta.
448 Otimização sem restrições

*[66] Seja U um subconjunto convexo de W . Mostre que / : U C ^ Ré


convexa se, e somente se,

5W = / ( í - p + ( i - í ) - q )

é uma função convexa, onde p e q são pontos quaisquer em /7 e í G [0,1].


Em outras palavras, mostre que uma função definida em um conjunto
convexo é convexa se, e somente se, sua restrição sobre qualquer seg­
mento de reta em U é uma função convexa.

*[67] Seja / : R^ R uma função convexa. Mostre que se f é limitada


superiormente, isto é, se existe uma constante M G R tal que f{'x.)< M
para todo x G R^, então / é uma função constante em R’^.

*[68] (A desigualdade de Jensen)

(a) Mostre que uma função / : [/ C R^ R definida em um conjunto


convexo Í7 de R^ é convexa se, e somente se,
f{ai • p + • q) < Q!i • /( p ) + • /(q),
para todo p, q G Í7 e para todo ai, 0^2 > 0 com ai + a 2 = 1.
(b) Mostre que uma função / : C7 C R^ —)►R definida em um conjunto
convexo Í7 de R^ é convexa se, e somente se,
/(ü!i • Pi + • • • + • p„) < a i • /(p i) + • • • + a„ • /(p „),
para todo P i , . • •, p^ € Í7 e para todo a i , . . . , > 0 com
0^1 + • • • + O^n — 1-
(c) Use 0 item anterior com a função convexa y = f[x) = —ln(a:) para
obter a desigualdade entre as médias aritmética e geométrica:
Xi + X2-\---- Xn
<yXi • X2 Xji ^
n
onde xi, rc2, . . . , são números reais positivos.

[69] Sejam uç^ = ln(a:) e, para 0 < ce < 1, Ua{x) = [x^ — l)/» , definidas no
conjunto C/ = {x G R | x > 0}.

(a) Mostre que uo{x) = lima^o+ para todo x G f7.


(b) Mostre que, para todo a G [0,1], a função Ua é côncava, estritamente
crescente e satisfaz Uq(1) = 0.
11.7 Exercícios 449

Estas funções são usadas em Economia para modelar o benefício ou


utilidade em função da quantidade de bens ou dinheiro. A concavidade
de Ua significa que a utilidade marginal (isto é, o acréscimo na utilidade
obtido por um acréscimo fixo na quantidade de bens) decresce quando
a quantidade de bens cresce. Em outras palavras, concavidade modela
o efeito de satisfação.

[70] Diga se cada uma das seguintes sentenças abaixo é verdadeira ou falsa,
apresentando uma justificativa caso ela seja verdadeira ou um contra-
exemplo caso ela seja falsa.

(a) Seja U um subconjunto convexo e aberto de M^. Se f e g são funções


convexas de classe definidas em Í7, então f + g também é uma
função convexa em U.
(b) Seja U um subconjunto convexo e aberto de W . Se f e g são funções
convexas de classe definidas em C/, então / • g também é uma
função convexa em U.

[71] Use o método dos mínimos quadrados para encontrar a reta que melhor
aproxima os pontos (0,1), (1,3), (2,2), (3,4) e (4, 5). Faça um desenho
dos pontos e da reta.

[72] Use 0 método dos mínimos quadrados para encontrar a reta que melhor
aproxima os pontos (1,1), (2,1), (4, 0), (7,2) e (9, 9). Faça um desenho
dos pontos e da reta.

[73] Seja y = á^x + 6* a reta que “melhor” aproxima os pontos (a;i,yi), . . . ,


i^n^yn) de acordo com o método dos mínimos quadrados.

(a) Mostre que

Y^{a*x + b* - yi) = 0,
2=1

isto é, mostre que os desvios positivos e negativos se cancelam,


(b) Mostre que a reta y — a*x + h* sempre passa pelo ponto

(=^.y)= ( \
2=1 / / \2=1
formado pelas médias aritméticas dos dados Xi e yi, com 1 < í < n.
450 Otimização sem restrições

*[74] (Classificação de form as q u ad ráticas via autovalores) Seja A


uma matriz quadrada n x n . Dizemos que um número A é autovalor de
A se existe um vetor x G (denominado autovetor de A)^ com x 7^ 0,
tal que A • x = A • x.
(a) Considere

A=

Quais dos vetores abaixo


■2 ■ ■- 1 ■ ■0 ■
3 , y=
X= e z=
1 1
são autovetores da matriz A? Quais são os autovalores associados?

Como encontrar os autovalores de uma matriz A sem ser por tentativa


e erro? Observe: se x é um autovetor associado a um autovalor A então
sabemos que

A •X = A •X

ou, ainda,

A -x —A - / - x = 0,

com I a matriz identidade n x n . Desta maneira,

( A - A - / ) - x = 0, (11.12)

ou seja, o vetor x é uma solução não-nula do sistema linear homogêneo


(A —A • /) • X = 0. Isto significa que o sistema linear possui infinitas
soluções (sistema possível e indeterminado). A fim de que isto ocorra
A —A • 7 não pode ser uma matriz inversível, logo det(A —A • 7) = 0.
Desta maneira, para se encontrar os autovalores de uma matriz A, basta
encontrar as raízes do polinómio característico p(A) = det(A —A • 7).

(b) Calcule os autovalores da matriz A definida no item (a).

E como calcular os autovetores sabendo-se os autovalores? Basta subs­


tituir o valor do autovalor A na equação (11.12) e encontrar uma (das
infinitas) soluções do sistema formado. Por exemplo, A = —1 é um
11.7 Exercícios 451

autovalor da matriz A do item (a). Substituindo este valor em (11.12)


temos
1 2 1 0 Xi
(A - A • /) • X = (-1)
2 1 0 1 X2
2 2 ’ Xi ■0 ■
2 2 . ^2 . 0

É fácil de ver que

■- 1 ■
X =
_ ^2 . 1

é uma solução (entre infinitas) do sistema e, portanto, constitui um au-


tovetor de A associado ao autovalor A = —1. Para se resolver o sistema
em uma situação geral você pode utilizar a técnica de escalonamento
ensinada no segundo grau (lembra-se?).

(c) Encontre um autovetor associado ao outro autovalor da matriz A


do item (a).
(d) Encontre os autovalores e os correspondentes autovetores da matriz
1 2 0
B = 2 10
0 0 7
(e) Mostre que se v é um autovetor de uma matriz A associado ao
autovalor A, então o vetor t • v (um múltiplo escalar do vetor v)
também é um autovetor de A associado ao mesmo autovalor A,
para todo t ^ 0.

Mas qual a relação entre autovalores e autovetores com o processo de


se transformar uma matriz simétrica em uma matriz diagonal? Vamos
ilustrar o processo através de um exemplo. Considere a matriz

1 2
A=
2 1

Os autovalores de A são Ai = —1 e A2 = 3, com os autovetores

-1
X = e y=
1
452 Otimização sem restrições

respectivamente. Será interessante usar autovetores de tamanho 1. Para


consegui-los, basta dividir x por ||x|| e y por ||y|| (note que, pelo
item (e), dividir um vetor por um escalar não-nulo não destrói a pro­
priedade do vetor ser autovetor para o mesmo autovalor):

X ■- 1 / V 2 ' ■+ l / \ / 2 ■
u= p V - y -
I MI “ . + y ^ 2 . ^ " - | | y i r . + V v ^ .

Uma vez que u e v são autovetores (de tamanho 1), temos

■1 2 ■ ■-1 /V 2 ‘ — í ■- l / \ / 2 ‘
2 1_ +l/^/2 _ . 4- 1/ _
■1 2 ■ +1/\/2 ■ + l/\/2'
_2 1 _+1/\/2 _ - •
.+1/V2.
Agora, 0 “pulo do gato” é escrever estas duas igualdades em uma única
igualdade, colecionando os autovetores em uma única matriz:

'12' -1/V2 +l/\/2 -1 /v ^ + l/v ^ ■- 1 0 ■


2 1_ + 1 /V2 + 1 /\/2 _ +1/^/2 + 1 /^ 2 0 3

isto é

1 2 -1 0
■P = P
2 1 0 3

onde P é a matriz formada pelos autovetores. Multiplicando-se os dois


lados desta última igualdade obtemos que P~^ • A - P = D isto é,

p -i. 1 2 -1 0
■P =
2 1 0 3

Podemos ainda escrever que A = P ■D • P ^, isto é,

1 2 -1 0
= P-
2 1 0 3

Outro fato surpreendente é que P ^ = P ^ indica transposição):

-1 /V 2 +1/V2
P-^ = = P^
_-|-l/\/2 -fl/v ^ _
11.7 Exercícios 453

isto é, a inversa e a transposta de P são iguais. Para que isto ocorresse,


foi fundamental tomar os autovetores de A com tamanho 1. Resumindo:
P é uma matriz ortogonal (isto P • P^ = I) e vale que
1 2 -1 0
= P.
2 1 0 3

(f) Diagonalize a matriz B do item (d), isto é, encontre uma matriz P


tal que B = P • D • com D uma matriz diagonal.
(g) Mostre que se P é uma matriz ortogonal (isto P • P^ = I)^ então
P é uma matriz inversível.

0 que fizemos para a matriz A do item (a), pode ser feito para qualquer
matriz simétrica, isto é, toda matriz simétrica n x n pode ser diagonalizada.
Este é um resultado importante de Álgebra Linear e ele é conhecido como o
Teorema Espectral.

T eorem a 1 1 ,1 5 (T eorem a E sp e c tr a l) Seja A uma m atriz sim étrica


n x n . Então existe uma m atriz P de tam anho n x n , ortogonal (e^
portanto, inversível), ta l que

dl 0 •• • 0
0 d2 • • 0
A ^P ^

0 0 ■0
onde dl, d2? ?dn são os autovalores da matriz A,

O Teorema Espectral permite usar os autovalores de uma matriz para classifi­


car a forma quadrática correspondente. De fato, se A é uma matriz simétrica
n x n então, pelo Teorema Espectral, existe uma matriz P ortogonal tal que
A = P •P •P^, onde os elementos da diagonal principal de B são justamente
os n autovalores de B. Escrevendo M = P^, de forma que P = M^, temos
que assim,

Q(h) = = = = g (x ),

onde X = M • h e Q(x) = x^ • P •x. Uma vez que M é uma matriz inversível,


(pois M é ortogonal, veja o item (g)), segue-se que o tipo de positividade
454 Otimização sem restrições

de Q é 0 mesmo tipo de positividade de Q. Mais precisamente, mostre que

(h) Q é positiva definida se, e somente se, Q é positiva definida; Q é negativa


definida se, e somente se, Q é negativa definida; etc.

Mas estudar a positividade de <5 é muito fácil pois Q é& forma quadrática de
uma matriz diagonal! Você pode então usar os resultados do exemplo (11.14)
para concluir o próximo teorema.

, Teorerasf 11,16 Se)a A uma matriz simétrica.


; ;(a ) A é ,positiva definida se,,e somente se, todos os seus autovaloreã
' São pósitivos'.

(b) A é negativa definida se, e somente se, todos os seus autovalores


são negativos.

(c) A é positiva semiddimda se, e somente se, todos os seus autovalores


: são,màiorés,0%iguais,áiiz&'oY^ f./-;'"
(d)\A 'dpfinída sé^.b èbtoénte se, todos os seus autovalores
sao menores ou iguais a zero.

(e) 4 '6 'i^<Í6fimda se, e somente se, existe pelo menos um autovalor
. po^tiyp éípelo menos um autoválor negativo.

( i ) Classifique a positividade das matrizes dos exercícios [16] a [23] usando


0 teorema (11.16). Qual método você prefere? Lagrange, menores prin­
cipais ou autovalores?

11.8 Leitura suplementar

Polinómios de Taylor de ordem maior do que 2 podem ser considerados. O


polinómio de Taylor pk de ordem k no ponto p de uma função / de classe C*
é 0 único polinómio de grau k cujas derivadas parciais de ordem menor ou
igual a k coincidem, respectivamente, com as derivadas parciais de ordem
menor ou igual a A: da função / no ponto p. Contudo, se k > 3, não é
possível representar pk com o uso de matrizes, isto porque não existe uma
11.8 Leitura suplementar 455

representação matricial para o que seria ^^a derivada de ordem A:” de uma
função de n variáveis. Não vamos desenvolver a teoria dos polinómios de
Taylor de ordem maior ou igual a 3 aqui. Indicamos ao leitor interessado as
referências [01, 48, 71].
Pierre de Fermat (1601-1665) considerou o problema do cálculo de máximos,
mínimos e retas tangentes em seus estudos do trabalho de Kepler sobre o
paralelepípedo de maior volume que pode ser inscrito em uma esfera (veja
a figura (11.24)) e do trabalho de Viete sobre a relação entre os coeficientes
e as raízes de um polinómio. Para uma excelente descrição de como Fermat
resolvia problemas de otimização (sem o uso de derivadas, que ainda não
tinham sido inventadas na época), indicamos a referência [70].

Figura 11.24: O problem a de Kepler: encontre o paralelepípedo de maior


volume inscrito em um a esfera.
Capítulo 12

Otimização com restrições


Um dos objetivos deste curso é o de tentar criar mecanismos que permitam
resolver o problema de otimização

maximizar /(x )
sujeito a X 6 D,

isto é, queremos encontrar (caso exista) um ponto p no conjunto admissível D


para o qual o valor da função-objetivo f seja o maior possível se comparado
com o valor de / nos demais pontos de D.
No capítulo anterior vimos que se o problema de otimização possui uma
solução p no interior do conjunto admissível D então, pela regra de Fermat,
p deve ser um ponto crítico de / , isto é, V /(p ) = 0.
Contudo, se uma solução p do problema de otimização não está no interior
do conjunto admissível D, então não é necessário que p seja um ponto crítico
de / . Considere, por exemplo, o seguinte problema de otimização:

maximizar /(Xl,X2) = \+ ^ 2
sujeito a (xi, X2) G D = {(xi, X2) G x?/4 + x ^ /9 = 1}.

Este problema de otimização possui duas soluções, a saber, os pontos

p = ( 0 ,- 3 ) e q = ( 0 ,+ 3 ) .

Por outro lado, p e q são pontos de fronteira de í? e não são pontos críticos
de / (veja a figura (12.1)). Se não podemos aplicar a regra de Fermat para
estes pontos, como vamos caracterizá-los algebricamente? A resposta é dada
pelo teorema dos multiplicadores de Lagrange ou, mais geralmente, pelo
teorema de Karush-Kuhn-Tucker, que vamos estudar neste capítulo.
458 Otimização com restrições

Figura 12.1: Os pontos p = (0, - 3 ) e q = (0, +3) são extremos globais de /


em D = {{x\,X 2) € | x \/A + x \ / ^ = 1} mas p e q não são
pontos críticos de f .
12.1 Otimização com uma restrição em igualdade 459

12.1 Otim ização com uma restrição em igualdade

Vamos começar com um exemplo bem simples: uma função-objetivo de


duas variáveis e um conjunto admissível D definido como a curva de nível
de uma função /i, também de duas variáveis. Assim:

maximizar 2:2)
sujeito a (xi,X2) E D = {(xi,X2) E | h{xi,X 2) = c}.

Na figura (12.2) estão desenhadas a curva de nível h = c de h {o conjunto


admissível D) e as curvas de nível / = ci, / = C2, / = C3 e / = C4 de / .
Vamos supor que 0 valor da função / em uma de suas curvas de nível é
sempre maior do que o valor nas curvas de nível abaixo desta. Sendo assim,
na figura (12.2), temos ci < C2 < C3 < C4.
Com este cenário, 0 ponto q não pode ser um extremo local de f no
conjunto admissível D. Para ver isto, basta observar que existem curvas
de nível / que interceptam D em pontos arbitrariamente próximos e do
lado direito de q. Estas curvas de nível estão acima da curva de nível que
passa pelo ponto q. Portanto, existem pontos do conjunto admissível D
arbitrariamente próximos e do lado direito de q para os quais o valor da
função / é maior do que o valor da função no ponto q. Conclusão: q não
pode ser um ponto de máximo local de / em D. Analogamente, existem
curvas de nível de / que interceptam D em pontos arbitrariamente próximos
e do lado esquerdo de q. Estas curvas de nível estão abaixo da curva de nível
que passa pelo ponto q. Portanto, existem pontos do conjunto admissível D
arbitrariamente próximos e do lado esquerdo de q para os quais o valor da
função / é menor do que o valor da função no ponto q. Conclusão: q não
pode ser um ponto de mínimo local de / em D. Este argumento mostra que
um ponto do conjunto admissível D onde a curva de nível de / e a curva de
nível de h (que define o conjunto D) se interceptam transversalmente não
pode ser um extremo local de / em D.
Por outro, na figura (12.2), a curva de nível de / que passa pelo ponto p
é tangente à curva de nível de h (que define o conjunto admissível D). As
curvas de nível que interceptam 0 conjunto D tanto do lado direito quanto
do lado esquerdo do ponto p estão sempre abaixo da curva de nível de / que
passa por p. Portanto, o valor de / em pontos do lado esquerdo e do lado
direito de p é sempre menor do que o valor da função no ponto p. Conclusão:
460 Otimização com restrições

o ponto p é um ponto de máximo local de / em D.

Figura 12.2: Se p é um ponto de máximo de / na curva de nível h = c, então


a curva de nível de / que passa por p é tangente à curva de
nível h = c.

Mas como caracterizar algebricamente um ponto p com esta propriedade?


Se vetor gradiente V/i(p) de h no ponto p é diferente de zero, pelo teo­
rema (9.5) da página 333, sabemos que ele é perpendicular à curva de níve.
h = c no ponto p e, analogamente, se o vetor gradiente V /(p ) de / no
ponto p é diferente de zero, então ele é perpendicular à curva de nível / = C3
no ponto p. Como as curvas de nível h = c e f = são tangentes em p.
concluímos que os vetores V/i(p) e V /(p ) devem ser paralelos em p (veja a
figura (12.3)). Desta maneira, existe um número real A tal que

V /(p ) = A-V/i(p). ( 12.1

É a condição (12.1) que substitui a regra de Fermat como um “filtro” de pri­


meira ordem para extremos de uma função / em um conjunto admissível D.
construído como a curva de nível de uma função h.
12.1 Otimização com uma restrição em igualdade 461

Figura 12.3: Os gradientes V /( p ) e V /i(p) são paralelos em um extremo


local de / em D.
462 Otimização com restrições

-'^ T eorem a 1 2 , 1 (dos multiplicadores de L agrange) Sejam / e


h fianções de classe de duas variáveis e seja p = (j>uP2) um a solução
”* (local) do problem a de o tim iza ç^ ‘

m axim izar /(® i >


sttjisitó a (a?i, 2:2) € i? = {(aJi, 2:2) '€ | H{x í ,X2) — c}

Suponha <iue p = (pij P2 ) satisfaça a seguinte condição de regularidade:

' Bntáò ex iste lim nám ero real A* (o m ultiplicador de Lagrange) tal que

(12.2)

^ isto é, 0 ponto (pi>;P2>-^*) é áoluçãó do sistem a ,

■11 df f . \ ( \ i

= A ~ ( x , , o:2), (12.3)

! h{zi, X 2) = c,

dehoráinâdò de condições de'frinteira ordem para o ponto p = (p i,p 2)

O bservação. A condição de regularidade Vh(p) 7^ 0 exigida pelo teorema


dos multiplicadores de Lagrange garante que podemos usar o teorema (9.5)
para concluir que o vetor gradiente V/i(p) é perpendicular à curva de nível
h = cno ponto p. Lembramos que este teorema, por sua vez, usa 0 teorema
da função implícita para demonstrar este fato geométrico, daí a necessidade
da condição de regularidade. Por outro lado, não é necessário que 0 vetor
gradiente V /(p ) de / no ponto p seja diferente de zero (apesar de termos
usado este fato na justificativa geométrica que precede o teorema (12.1)). De
fato, se p é um ponto de máximo de / no conjunto admissível D e V /(p ) = 0 ,
basta considerarmos A = 0 no sistema (12.2). Evidentemente, neste caso, as
curvas de nível de f e h que passam por p não são necessariamente tangentes
(veja o exercício resolvido (12.2) mais adiante). Para uma demonstração do
12.1 Otimização com uma restrição em igualdade 463

teorema dos multiplicadores de Lagrange, veja a referência [71].


Existe uma maneira conveniente de se escrever as condições de primeira
ordem (12.3). Para isto, definimos o lagrangeano

L{xi, X2, A) = /(a;i, X2) - A • [h{xi, x^) - c].

Agora, como
dL , . df , . dh . ,
— (a;i,X2,A) - — (x i ,X2 ) - A - — (xi,X2),
dL df dh
^ ( x i ,X2,A) = ^ K ^ 2 ) - A - — (X1,X2), (12.4)

^ ( a :i,X 2,A) = -{h {x i,X 2} - c),

segue-se que {xijX 2jX) satisfaz as condições de primeira ordem (12.3) se, e
somente se, (xi, X2, A) é um ponto crítico do lagrangeano L. Este resultado é
muito interessante! Ele diz que, procurar pelos candidatos à solução de um
problema de otimização com uma restrição em duas variáveis, isto é, procurar
pelas soluções do sistema formado pelas condições de primeira ordem (12.3),
é o mesmo que procurar pelos pontos críticos do lagrangeano, isto é, procurar
pelos candidatos à solução de um problema de otimização sem restrições em
três variáveis.

O bservação. Se estivéssemos interessados em minimizar a função-objetivo /


no conjunto admissível

D = {(xi, X2) e I h{xi,X 2) = c},

ao invés de maximizá-la, 0 mesmo argumento geométrico usado para motivar


o teorema (12.1) poderia ser empregado para concluir que, também neste
caso, um ponto p = (p i,P 2) é mínimo de / em D e que satisfaz a
condição de regularidade V/i(p) 0 é tal que existe A G M para o qual o
ponto (pi,P2, A) satisfaz as condições de primeira ordem (12.3) ou ((12.4)).

T eorem a 12.2 ( d o S M ULTIPLICADOEES de L a G EA N G E) Sejam / e


||||i||||i ||S |Í |||Í |||||J ^ ^ ^ ^
|||||||ii i ||||||||||||||l |p
464 Otimização com restrições

Suponha que p = (pi, P2) satisfaça a seguinte condição de'regularidade:


dh , . dh
V h (p ) = ^ -(pi,P 2),i^(p h P 2 }J ?^(0,0).

Então existe um ntímero real A* (o m ultiplicador de Lagrange) tal que


(p , A) = A) é ponto crítico do lagrangemio

£(a;j, a?2!'A ) ~~ 3!^) ! Á ,> 212) c|*


, Bni outras palavras:

* i í ' -(pa,P2,A*)
. ' " - 0,
dxii i l l i l B i l B I i j i P !
S -(Pi ,P2,A*) = 0,1
Si
-(p i ,P2,A*) = 0.
aA^

Exercício resolvido 12.1 Resolva o seguinte problema de otimização

maximizar /(Xi, X2) = X\X2


sujeito a (xi, X2) E D = {(xi, X2) 6 | h{xi, X2) = Xi + 4 X2 = 8}.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 1. As funções f e h são de classe como soma e multiplicação


de funções de classe C^.
• P asso 2. Verificar a condição de regularidade.
A condição de regularidade exigida pelo teorema (12.2) diz que o gra­
diente de h deve ser diferente de zero em cada solução do problema
de otimização. Mas como verificar a condição de regularidade se ainda
não conhecemos a solução do problema de otimização? De fato, 0 que
queremos é justamente encontrar a solução (ou soluções) do problema!
A idéia é mostrar que todos os pontos do conjunto admissível (isto é,
todos os pontos (xi, X2) em R^ tais que h{xi, X2) = x i+ 4 X2 = 8) satisfa­
zem a condição de regularidade! Com isto, caso exista alguma solução
do problema de otimização, certamente ela irá satisfazer a condição
12.1 Otimização com uma restrição em igualdade 465

de regularidade exigida pelo teorema dos multiplicadores de Lagrange.


Como

V/l(xi,X2) = = (1,4)

segue-se que V/i(xi, X2) / (0, 0) para todo {xi, X2) em em particular,
V/i(xi, X2) ^ (0, 0) para todo ponto (a:i, X2) do conjunto admissível.

• P asso 3. Escrever o lagrangeano.

L{xi, X2, A) = f{xi, X2) - X ’ [h{xi, X2) - c] = X\X2 - X • {xi + 4x2 - 8).

• P asso 4. Escrever as condições de primeira ordem.

( dL ,
— (Xi ,X2,A) = 0,
X2 - A = 0, (1)
dL, .
(Xi ,X2,A) — o, => xi —4 A = 0, (2)
xi + 4 x2 = 8. (3)
— [Xi,X2,X) = 0,

• P asso 5. Resolver o sistema correspondente às condições de primeira


ordem.
De (1) e (2) temos = 4 A e X2 = A. Substituindo estes valores em (3)
concluímos que 4 A + 4A = 8, isto é, A = 1. Portanto, xi = 4 A = 4 e
X2 = X = 1. Assim, o sistema correspondente às condições de primeira
ordem possui uma única solução: (xi, X2, A) = (4,1,1).
• P asso 6. Conclusão.
Apesar do sistema correspondente às condições de primeira ordem pos­
suir uma única solução, não podemos afirmar de imediato que o ponto
(xi,X2) = (4,1) é solução do problema de otimização! A exemplo da
regra de Fermat, nem todo ponto que satisfaz as condições de primeira
ordem é solução do problema de otimização! O que dizer enão do
ponto (4,1)? Mais adiante construiremos um classificador das soluções
do sistema correspondente às condições de primeira ordem (isto é, um
classificador dos pontos críticos do lagrangeano) da mesma maneira que,
no capítulo anterior, construímos um classificador de pontos críticos
para o caso de problemas de otimização sem restrições. Por outro lado.
466 Otimização com restrições

com 0 desenho das curvas de nível de / e do conjunto admissível (veja a


figura (12.4)), não é difícil de se convencer que, de fato, (4,1) é solução
do problema de otimização. b

Figura 12.4: Desenho das curvas de nível de / (os números indicam o valor do
nível) e do conjunto admissível (curva com traçado mais forte).

Exercício resolvido 12.2 Resolva o seguinte problema de otimização

maximizar f X 2) — X-^X2
sujeito a (xi, X2) G D = {(a^i, X2) G | h{xi, X2) = 2 x \ + xl = 3}.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 1 . As funções f e h são de classe como soma e multiplicação


de funções de classe C^.
• P asso 2. Verificar a condição de regularidade.
A condição de regularidade exigida pelo teorema (12.2) diz que 0 gra­
diente de h deve ser diferente de zero em cada solução do problema
de otimização. Mas como verificar a condição de regularidade se ainda
não conhecemos a solução do problema de otimização? De fato, o que
queremos é justamente encontrar a solução (ou soluções) do problema!
12.1 Otimização com uma restrição em igualdade 467

A idéia é mostrar que todos os pontos do conjunto admissível (isto é,


todos os pontos (xi, X2) em tais que h{xi, X2) = 2 x?+X2 = 3) satisfa­
zem a condição de regularidade! Com isto, caso exista alguma solução
do problema de otimização, certamente ela irá satisfazer a condição
de regularidade exigida pelo teorema dos multiplicadores de Lagrange.
Como

V h {xi,X 2 )= ( ^ ( ® i ’ ^ 2 ),^ (a ;i,X 2 )^ = (4 a ;i,2 x 2 )

segue-se que V/i(xi,X2) = (0,0) se, e somente se, (xi,X2) = (0,0).


Como o ponto (0,0) não pertence ao conjunto admissível (uma vez que
h{0,0) = 0 < 3) segue-se que Vh{xi,X 2) ^ (0,0) para todo ponto
(xi,X2) do conjunto admissível.

• P asso 3. Escrever 0 lagrangeano.

L(xi, X2, A) = /(x i, X2) - A • [/i(xi, X2) - c] = x \x 2 - \ ' [2x\ + x \ - 3).

• P asso 4. Escrever as condições de primeira ordem.

^^^( xi ,X2,A) = 0,
f 2 x \X2 —4 Axi — 0, (1)
^ ( xi ,X2,A) = 0, => < xf —2 Ax2 = 0, (2)
( 2 xf + X2 = 3. (3)
dL
= 0,

• P asso 5. Resolver 0 sistema correspondente às condições de primeira


ordem.
De (1) temos que 2 x\ (x2 —2 A) = 0. Logo xi = 0 ou X2 = 2 A.
Se xi = 0 então, de (3), X2 = 3, isto é, X2 = —\/3 ou X2 = + \/3 . Sendo
assim, de (2), temos A = 0. Concluímos então que

(0 ,-V 3 ,0 ) (0, + V 3,0)

são soluções do sistema.


Se X2 == 2A, então X2 = 4A^ e, de (2), x\ = 4A^. Substituindo em (3)
obtemos 8 A^ + 4 A^ —3 = 0, isto é, A^ = 1/4. Assim, A = —1/2 ou
468 Otimização com restrições

A = +1/2. Se A = +1/2, então X2 = + l e x\ = 1, isto é, xi = ±1. Se


A = —1/2, então X2 = —1 e xf = 1, isto é, xi = ±1. Desta maneira,

(—1 ,+ 1,+ 1/2), (+ 1 ,+ 1 ,+ 1 /2 ), (—1 , - 1 , —1/2) e


( + 1 ,- 1 ,- 1 /2 )

também são soluções do sistema associado às condições de primeira


ordem.
• P asso 6. Conclusão.
A funçãoOobjetivo / é contínua (pois é de classe C^) e o conjunto ad­
missível é compacto (pois é uma elipse, veja a figura (12.5)). Pelo
teorema de Weierstrass, / possui máximos e mínimos globais no con­
junto admissível. Pelo teorema dos multiplicadores de Lagrange, qual­
quer solução do problema de otimização que estamos estudando deve ser
solução do sistema associado às condições de primeira ordem (a condição
de regularidade é fundamental aqui). Desta maneira, os pontos de
máximo de /(x i, X2) = xfx2 sujeitos à restrição /i(xi, X2) = 2 xf+X2 = 3
estão entre

(0, —\/3), (0,+ \/3), (—1,+1), (+1,+1), ( - 1 ,- 1 ) , e


(+ 1, - 1).
Para encontrá-los, basta calcular a função-objetivo nestes pontos e se­
lecionar os de maior valor. Como

f{o,-V3) = no,+vs) = 0,
/( - i,- i) = / ( + i , - i ) = - 1,
/( + i,+ i) = / ( - i , + i ) = -1 ,

segue-se que os pontos (+1,+1) e (—1,+1) são soluções do problema


de otimização.

Observe que, na figura (12.5), os vetores gradientes de f e h são paralelos


nos pontos (—1, —1), (—1, +1), (+1, —1) e (+1, +1). As curvas de nível de /
e h que pctssam por estes pontos são, de fato, tangentes. Por outro lado, 0
vetor gradiente de / se anula nos pontos (0, —\/3) e (0, + \/3), enquanto que
o vetor gradiente de h não. As curvas de nível de / (o eixo y) e h [bl elipse
2x1 + X2 — 3) não são tangentes nestes pontos! Mesmo assim, os pontos
(xi,X2, A) = (0, —\/3 ,0) e (xi,X2, A) = (0 ,+ \/3 ,0) satisfazem as condições
12.1 Otimização com uma restrição em igualdade 469

de primeira ordem e, pela figura (12.5), não é difícil de ver que (0 ,—\/3)
é um ponto de máximo local e (0, + \/3) é um ponto de mínimo local de /
em D. m

Figura 12.5: Desenho das curvas de nível de / (os números indicam o valor do
nível) e do conjunto admissível (curva com traçado mais forte).
Os vetores com seta branca indicam o gradiente de h enquanto
que os vetores com seta preta indicam o gradiente de /.

C U ID A D O ! C U ID A D O ! C U ID A D O !

A condição de regularidade não pode ser omitida no teorema dos


multiplicadores de Lagrange!

Para você se convencer deste fato, considere o problema de otimização


que consiste em
470 Otimização com restrições

maximizar /(^ b ^2) = ^2


sujeito a h[x\^ X2) = x? + X2 = 0.

As funções f e h são de classe e 0 lagrangeano para o problema de


otimização é dado por
L{xi, X 2 , X) = f{xi, X 2 )- X - [h{xi, ÍC2 ) - c] = X2 - A • (x\ + xl),
de modo que as condições de primeira ordem para o problema de oti­
mização são dadas por
dL ,
— (x i ,X2,A) = 0,
—2X x\ = 0, ( 1)
9L,
— (x i ,X2,A) = 0, 1 —3 AX2 = 0, (2)
^1 + ^2 = 0- (3)
{xuX2,X) = 0,
dX
Não existe ponto {xijX 2 j A) em que satisfaça as condições de primeira
ordem! De fato: de (1) temos que A = 0 ou = 0. Se A = 0, de (2)
temos que 1 —2 • 0 • = 0, isto é, 1 = 0, um absurdo. Por outro lado,
se Xl = 0, de (3) temos que x^ = 0, isto é, X2 = 0. Portanto, de (2),
segue-se que 1 —2 • A • 0 = 0, isto é, 1 = 0, também um absurdo.
Como o sistema associado às condições de primeira ordem não possui
solução, podemos então concluir que o problema de otimização também
não possui solução? A resposta a esta pergunta depende da condição de
regularidadel Neste exemplo, o problema de otimização possui solução!
Para encontrá-la, basta observar que

h{xi^ X2) = xl + xl = 0 ^ X2 = - \ / x ‘^V

isto é, um ponto (xi,X2) satisfaz a restrição x\ + x^ = 0 se, e somente


se, X2 = — Uma vez que x\ > 0 para todo xi G R, segue-se que
todos os pontos (xi,X 2) do conjunto admissível
D = {{xi, X2) G R^ I h{xi, X2) = Xl + ^2 = 0}
são tais que X2 < 0. Como nossa função-objetivo é /(x i,X 2) = ^2,
resolver o problema de otimização consiste em procurar o ponto do
12.1 Otimização com uma restrição em igualdade 471

conjunto admissível D com a maior ordenada. Desta maneira, não é


difícil ver que (0, 0) é a solução do problema de otimização. Na figura
abaixo temos um desenho com as curvas de nível de / (os números indi­
cam o valor do nível) e do conjunto admissível (curva com o traçado mais
forte). Os vetores com seta branca indicam o gradiente de h enquanto
que os vetores de seta preta indicam o gradiente de / .

Com esta figura, é fácil visualizar porque o ponto (0, 0) é máximo glo­
bal de /(xi,cc2) = X2 no conjunto admissível D formado pelos pontos
que satisfazem a restrição h{xi^X2) = x^ + x^ = 0, Também é fácil
visualizar porque não existem pontos que satisfazem as condições de
primeira ordem: não existem pontos (xi,X2) na curva x\ -h x^ para
os quais V f{x i^ X 2) = A • Vh{xi^X 2). Observe que, na origem (0,0),
^/(OjO) = (0)1) enquanto que V/i(0,0) = (0,0). Desta maneira,
V /(0, 0) = (0,1) ^ (0, 0) = A • (0,0) = A • V /i(0,0), para todo A G M.
Este exemplo compromete a veracidade do teorema dos multiplicadores
de Lagrange? A resposta é não! O teorema dos multiplicadores de La-
grange garante que qualquer extremo p de uma função / de classe em
um conjunto admissível formado por uma curva de nível de uma função h
também de classe irá satisfazer as condições de primeira ordem para
algum A G M desde que p satisfaça a condição de regularidade^ isto é,
desde que V/i(p) 7^ 0. A solução do problema de otimização acima
não satisfaz a condição de regularidade pois V/i(0, 0) = (0,0). Moral
da história: a condição de regularidade não pode ser omitida no teo­
rema (12.2).
472 Otimização com restrições

Vimos que não existe A G M tal que V /(0 ,0) = A • V /i(0,0), uma vez
que V /( 0 ,0) = (0,1) e V/i(0,0) = (0,0). Mas se usássemos dois mul­
tiplicadores, um para a função-objetivo e outro para a função-restrição,
isto é, se trocássemos a condição
v / ( p ) = V . V/i(p)
por

X*o-Vf{p) = X l V h { p ) ,
é fácil ver que a escolha AJ = 0 faz com que Ag • V /( 0 ,0) = A^ • V h(0,0)
para as funções f e h de nosso exemplo, independentemente da escolha
de AJ. Mais formalmente, se f e h são funções de classe e p é um
extremo de / sujeito a h{x) = c, então existem multiplicadores Ag e AJ
tais que

^0 •v /(p ) XI • Vh(p),
/l(p) c,
iK ,K ) (0, 0),
\* {0,1}.
Esta teorema é devido a Pritz John. A condição (Ag, AJ) 7^ (0,0) diz
que os multiplicadores Ag e Aj não são simultaneamente nulos. Evi­
dentemente, a situação desejável é que Ag = 1, pois caso contrário, a
função-objetivo desapareceria completamente das condições de primeira
ordem. A hipótese de regularidade, V/i(p) ^ 0, garante que podemos
tomar Ag igual a 1 no teorema de Pritz John.

O teorema (12.2) generaliza-se facilmente para funções que dependam de


mais do que duas variáveis.

Tçoreítíà 12.3 ,(bos MIíltiplicadòrES f)è LagraI^ôe) Sejam / e


A fimções de ciasse 0 - de n variáveis e seja p um extremo (máximo ou
míninao) local de Jf no conjunto admissível

' i ) '= { x € i r í A(x)^c}. ,


12.2 Otimização com várias restrições em igualdade 473

Suponha qtie p sátM aça a se g ç iité coBdição'dè:rè^u]i&idaxiè: ,

Então dxjste ú ia nám ero feaV'^; ={Pjraultip%^d|-)^^^ ía í; # P ,,


ponto crítico;dP"tó®rangeanp'“f,:"£f^^^^^^^^^ '--'-V •, í-';-;.-

L {x , X ) - J {:x . ) - X -{h {x ) ~ ò l. . '


E in outraa palavras: ; , - ; '

O bservação. A recíproca do teorema dos multiplicadores de Lagrange é


falsa! Nem todo ponto (p, A*) que satisfaz as condições de primeira ordem é
tal que p é um extremo de / sujeito à restrição h{x) — c. Como um contra-
exemplo, considere o problema de otimização que consiste em encontrar os
extremos de f{x , y ,z) = —y'^ + z sujeito à restrição h{x, y ,z) = z = 0. O
ponto (p, A*) = (0,0,0) satisfaz as condições de primeira ordem associadas
ao problema (exercício) mas p = (0,0), não é um extremo de / sujeito a
h{x, y,z) = z = 0 (exercício).

12.2 Otimização com várias restrições em igualdade

Vamos estudar agora o caso em que o conjunto admissível é construído


com 0 uso de várias restrições em igualdade. Mais precisamente, estamos
interessados em encontrar os extremos de uma função f de n variáveis no
conjunto admissível

D = {x 6 R" I ãl(x) = Cl, . . . , /ito(x ) = Cm}

formado por todos os pontos x de R" que satisfazem simultaneamente as m


restrições hi(x) = Ci, . . . , hm{x.) = Cm- Note que o conjunto D nada mais
é do que o conjunto de nível da função vetorial h(x) = (hi{x) , . . . , hn,(x))
de R" para R"* associado ao nível c = (c i,. . . , Cm)-

D = .Fc = {x e R" I h(x) = (/ii(x),. . . , hm(x)) = (c i,. . . , Cm) = c}.


474 Otimização com restrições

No caso de uma única restrição em igualdade (m = 1), vimos que a


hipótese V/i(p) 7^ 0 é fundamental, no sentido que ela nos garante que a
curva de nível h(x) = c pode ser escrita como 0 gráfico de uma função em
uma vizinhança de ponto p. No caso de várias restrições em igualdade, para
podermos escrever 0 conjunto de nível D = Tc como o gráfico de uma função
(vetorial), segundo 0 teorema (9.6) da página 343, é suficiente que a matriz
jacobiana

d h i. . dhx
Vfti(p) r\ (p)
■■ U X ji

9 h iji. . dhffi
V/im(p) (p)
Lax.<P> ■■ dXn

de h no ponto p possua uma submatriz m x m inversível, isto é, existe uma


escolha de variáveis ^xi^ (as variáveis independentes no teorema
da função implícita) para as quais a matriz

[dhi dhi
8X ..W ■■ -(p )

dhffi
(p)

é inversível. Uma maneira prática de fazê-lo, ao invés de tentar todas as


escolhas possíveis, é a seguinte: basta verificar que o número de linhas não-
nulas da matriz escalonada equivalente à matriz jacobiana de h no ponto p
é igual a m (0 número de restrições). Dada uma matriz A, o número de
linhas não-nulas da matriz escalonada equivalente a A é denominado posto
de A, Pode-se mostrar que este número independe da maneira como A foi
escalonada. Lembramos que uma matriz está escalonada se ela satisfaz as
seguintes propriedades:

(1) Se uma linha da matriz é nula, então todas as linhas subseqüentes


de A são nulas.
(2) Se uma linha da matriz é não-nula, então o número de zeros no início
desta linha é sempre maior do que o número de zeros no início da
linha precedente (caso exista).
12.2 Otimização com váricis restrições em igualdade 475

Com estas observações, o teorema dos multiplicadores de Lagrange generali-


za-se facilmente para o caso de várias restrições em igualdade.

T eorem a 1 2 .4 (p o s m u l t ip l ic a d o r e s d e L a g r a n g e ) Sejam / ,
Al, . . . , Am funções de classe de n variáveis e sejà-p um eidrem p
(m áxim o ou m ínim o) local dé / no conjunto adm i^ível

ü = { x 6 K" I A l(x),= Cl,. . . , Am(3c) = Cm}

Suponha que p satisfaça a seguinte condição de fegulaaridade: o, posto


da m atriz jacobiana

V A i(p) ' ÍT.! (P)


dXn

dhm
VAm(p)
mxn dXfi (P) J mxn

é igual a w (o ntímero de restrições). Então existem números reais


A*,. . ., (os m ultiplicadores de Lagrange) tais que

V /(p ) = Aí.VAi(p) + -.. + A^.VAm(p),

isto é, 0 vetor gradiente V /( p ) é um a combinação hnear dos vetores


gradiente V A i(p ), , . . , 'yAm(p). O sistem a acim a é denom inado de
condições de pnmetra ordem para o problema de otim ização. Equivar
lentem ente, o ponto (p, A*) = (pi, , . , p„, Aí , . . . , A^) é ponto crítico
do lagrangeano

L{x, A) “ /( x ) - Al ■(Ai(x) - Cl] \n ■ Gn])


isto é,

............
dL
(p,A *) = 0, (P ,A *)=0 .
d \t dXm
476 Otimização com restrições

Exercício resolvido 12.3 Resolva o seguinte problema de otimização

maximizar xyz
sujeito a + 7/^ = 1,
x + z = 1.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 1. As funções definidas por /(x , y, z) = xj/z, /ii(x, y, z) = x^+y^


e /i2(x,y, z) = X + z são de classe como soma e multiplicação de
funções de classe C^.

• P asso 2 . Verificar a condição de regularidade.


A condição de regularidade exigida pelo teorema (12.4) diz que o posto
de jDh(p), com h(p) = (/ii(p),/i2(p)), deve ser igual a 2 (o número
de restrições) em cada solução do problema de otimização. Mas como
verificar a condição de regularidade se ainda não conhecemos a solução
do problema de otimização? De fato, o que queremos é justamente en­
contrar a solução (ou soluções) do problema! A idéia é mostrar que
todos os pontos do conjunto admissível (isto é, todos os pontos (a:,y, z)
em tais que /ii(x ,y ,2:) = 1 e h2{x^y^z) = 1) satisfazem a condição
de regularidade! Com isto, caso exista alguma solução do problema de
otimização, certamente ela irá satisfazer a condição de regularidade exi­
gida pelo teorema dos multiplicadores de Lagrange. A matriz jacobiana
Dh(x, y, z) é dada por
õ h \. V dh \, V dh \, V
■ ^ (x ,!,,z ) g ^ (x .!/,z ) -3|^(x.!/,z) 2a; 2 y 0
dh2 / \ ^^2 / \ 0 h2 / \ _ 1 0 1_

Se X = 0, então y^ = 1, isto é, y = ± 1. Neste caso a matriz jacobiana

'o ±2 o' ■1 0 1 ■
r\j
1 0 1 0 ±2 0

tem posto 2. Se x 7^ 0, subtraindo-se 2 x vezes a linha 2 da linha 1 da


matriz jacobiana e substituindo o resultado na linha 2, concluímos que
12.2 Otimização com várieis restrições em igualdade 477

2x 2y 0 2x 2y 0
1 0 1 0 2y —2x

também tem posto 2. Desta maneira, todos os pontos do conjunto


admissível satisfazem a condição de regularidade.
• P asso 3. Escrever o lagrangeano.

L (x , 3/ , z ,Ai ,A2) = f { x , y , z ) - Xi[hi{x,y, z) - C i ] - X 2 [h2 {x, y, z) - C2]


- xyz - Al (x^ + - 1) - A2 (x + z - 1).

• P asso 4. Escrever as condições de primeira ordem.

^ 9L,
— { x , y , z , Xi , X2) = 0,
dx
dL
— (x,2/,z ,Ai ,A2) = 0, ' yz — 2 Al X —A2= 0, (1)
xz — 2 Ai‘y = 0, (2)
ÕL
— (x,y,z,Ai,A2) = 0, xy - X2 = 0, (3)
x2+ y2 _ (4)
ÕL
— { x , y , z , Xi , X2) = 0, X + z = 1. (5)
õL
— (x,y,z,Ai,A2) = 0,

• P asso 5. Resolver 0 sistema correspondente às condições de primeira


ordem.
Se y = 0, de (2) temos xz = 0 e de (3) temos A2 = 0. De (4) temos
x^ = 1, isto é, X = —1 ou X = + 1. Se X = —1, de (5), temos z = 1 —x =
2, mas isto contradiz o fato de que xz = 0. Se x = +1, de (5), temos
z = 1 —X = 0. Como A2 = 0 e X = +1, de (1) temos Ai = 0. Desta
maneira, a única solução do sistema para 0 caso y = 0 é 0 ponto

(x, y,z, Al, A2) = (1,0,0,0,0).

Se 2/ 0, de (2) e (3) temos que


xz
Al = — e \2 = xy.

Substituindo estes valores na equação (1), segue-se que


478 Otimização com restrições

xz
yz — — X — xy = Q ^ —x ‘^z —xy‘^ = 0.
y

De (4) temos y^ = 1 — e, de (5), 2: = 1 —x. Substituindo estes valores


na expressão acima, concluímos que

(1 —x)^(l — x) — x ‘^{l — x) — x{l — = 0.

Uma vez que 1 — = (1 — x)(l + x), podemos colocar (1 —x) em


evidência na expressão acima, de forma que

(1 —x)(l —X —3 x^) = 0.

Sendo assim, 1 —x = 0 o u l —x —3 x^ = 0, isto é,

, -l-\/l3 - l + \/l3
X = 1 ou X = ------------ ou X = ----- ------ .
6 6
Com os valores possíveis de x, podemos facilmente calcular os valores
de y, Al e A2 com as fórmulas
XZ
= 1- z=l-x, Al = — e A2 = xy.
2y

Portanto, as soluções do sistema associado às condições de primeira


ordem para o caso y 7^ 0 são

6 6 ’ 6 12 ' 9
- 1 - V l3 , y/ 2 2 - 2 y i3 7 + VTS \/82 -1- 22 V 16 + V Í3
6 " 6 ’ 6 ’ 12 9
—1 + \/Í3 V 2 2 -I-2 V Í3 7 - V Í 3 y/82 - 22 \/Í3 v / l 6 - VÍ3
6 6 ’ 6 ’ 12 9
-l-h \/Í3 \/22 + 2v/Í3 7 - \ / l 3 V^82 - 22 \/Í3 1 \ / l 6 - \ / Í 3
^---- , + ■1
12 5

P asso 6. Conclusão.
A função-objetivo / é contínua (pois é de classe C^) e o conjunto ad-
12.2 Otimização com várias restrições em igualdade 479

missível é compacto (pois é uma elipse, resultante da interseção do ci­


lindro = 1 com o plano x + z = veja a figura (12.6)). Pelo
teorema de Weierstrass, / possui máximos e mínimos globais no con­
junto admissível.

Figura 12.6: O conjunto admissível é a elipse resultante da interseção do


cilindro 4- = 1 com o plano x - h z = 1.

Agora, pelo teorema dos multiplicadores de Lagrange, qualquer solução


do problema de otimização que estamos estudando deve ser solução do
sistema associado às condições de primeira ordem (a condição de re­
gularidade é fundamental aqui pois, com ela, temos a garantia de que
qualquer solução do problema de otimização também será solução do
sistema associado às condições de primeira ordem, para valores adequa­
dos dos multiplicadores de Lagrange).
480 Otimização com restrições

Desta maneira, os pontos de máximo de f{x,y^z) = xyz sujeitos às


restrições hi{x^ j/, z) = + 2/^ = 1 e h 2 {x^ y^z) = x + z = l estão entre

-l-^ /T 3 \/22 - 2 v T3 7 + VÍ3


6 6 6
-1 -V IS , \/22 - 2 v/l3 7 + VÍ3'
6 ' 6 6
- l + \/Í3 V 22 + 2 VÍ3 7 - V 13
6 6 6
- l + ^/Í3 V 22 + 2 v/Í3 7 - VÍ3
6 ' 6 6
(1,0,0).
Para encontrá-los, basta calcular a função-objetivo nestes pontos e se­
lecionar os de maior valor. Temos

-l-\/Í3 \/22 - 2 \ / l 3 7 + \ / l 3
/ + 0 .8 6 9 ...,
6 6 6

- 1 - VÍ3 V 22 - 2 V Í3 7 + ^
/ -0 .8 6 9 ...,
6 + 6 6

- 1 + VÍ3 \ / 2 2 + 2 ^/I3 7 - V 1 3
/ -0 .2 2 1 ...,
6 6 6

- 1 + V l3 V 22 + 2 V i s 7 - V l3
/ 1 5 + 0 .2 2 1 ...,
6
/ (1,0,0) 0.
Conseqüentemente, o ponto

-l-\/Í3 V2 2 - 2 V l 3 7 + V Í 3

é a solução do problema de otimização, isto é, ele é ponto de máximo


global de / no conjunto admissível

D = {(x, 2/, z) 6 I x^ + 2/^ = 1 e X + >2^= 1}.


12.2 Otimização com várias restrições em igualdade 481

Note que, por outro lado,

/-1 - -V /1 3 7 + V l3 \
------- 6------- ■ - ê - )

é ponto de mínimo global de / em D. Pode-se mostrar (exercício) que

- 1 + ^13 ^ \/22 + 2 VÍ3 7 - V l 3

Í - 1 + V13 \/22 + 2 v/Í3 7 - \ / Í 3 \


y 6 ’ 6 ’ 6 y
são, respectivamente, pontos de mínimo local e máximo local de / em D.
Pode-se mostrar também que o ponto (1,0, 0) não é extremo local de /
no conjunto admissível D. a

Vamos agora tentar interpretar geometricamente as condições de primeira


ordem no caso particular de uma função-objetivo de três variáveis e com um
conjunto admissível construído através de duas funções-restrições hi e h2'-

V f { x , y , z ) = X-i ■Vhi{x,y,z) + X2 - V h 2 {x,y,z),


h\{x,y,z) = Cl,
h2{x,y,z) = C2.

Seja p = {pi,P2,P2i) um ponto do conjunto admissível (isto é, p satisfaz


as restrições /ii(p) = ci e /i2(p) = C2) e suponha que não existam multiplica­
dores Al e A2 para os quais {pi , P 2 ,Ps, Ai, A2 ) seja solução do sistema acima.
Se p satisfaz a condição de regularidade, isto é, se a matriz jacobiana

dh
u n \ . , õh\ . , õh\ . ,
V/ii(p)

V/i2(p) dh2, . dh2, . dh2, .


2x3 dxi ^ dx2 ^ dxz^^ J 2 x3

tem posto 2, então p não pode ser um extremo local de / sujeito às restrições
= Cl e /i2 = C2. O fato de p ser um ponto regular tem várias implicações
geométricas.
482 Otimização com restrições

1. Se p satisfaz a condição de regularidade então, em particular, V/ii(p) 7^ 0.


Assim, pelo teorema da função implícita, sabemos que 0 conjunto de nível
h\ = c\ é gráfico de uma função de duas variáveis em uma vizinhança do
ponto p. Geometricamente, isto significa que 0 conjunto de nível h\ = c\ é,
em uma vizinhança do ponto p, uma superfície em (como um “lençol”
deformado) e não um objeto geométrico degenerado (como um ponto, uma
curva ou todo o
2. Analogamente, se p satisfaz a condição de regularidade então, em par­
ticular, V/i2(p) 7^ 0 e, portanto, geometricamente, o conjunto de nível
^2 = C2, em uma vizinhança do ponto p, também é uma superfície em R^
“legítima” (outro “lençol” deformado).
3. O conjunto admissível é formado pelos pontos em R^ que satisfazem as
restrições h\ = c\ e h2 = C2 simultaneamente. Geometricamente, isto
significa que o conjunto admissível é a interseção das duas superfícies (a
interseção dos dois “lençóis” deformados) h\ = ci e h2 = C2> Observe que
a interseção de duas superfícies pode ser uma curva, um ponto ou mesmo
uma superfície ou o conjunto vazio (pense em alguns exemplos). Gontudo,
novamente, a condição de regularidade impõe características geométricas:
0 conjunto admissível deve ser uma curva em uma vizinhança do ponto p.
Para ver isto, você pode aplicar a versão geral do teorema da função
implícita (teorema (9.6)) ou seguir 0 seguinte argumento geométrico infor­
mal: como vimos, a condição de regularidade nos garante que V /ii(p ) 7^ 0
e V/i2(p) 7^ 0 . Mais ainda, ela garante que o posto da matriz jacobiana

V/zi(p)

V /l2(p)
•j 2x3

é igual a 2. Isto significa que as duas linhas desta matriz não são uma
múltipla da outra. Geometricamente, isto significa que os vetores gradi­
entes V/ii(p) e V/i2(p) (as linhas desta matriz) não são paralelos. Assim,
as duas superfícies de nível não podem se tocar (uma situação que seria
favorável a uma interseção formada por um ponto ou uma superfície). As­
sim, as duas superfícies de nível devem se interceptar “transversalmente” ,
gerando uma curva.
No exercício resolvido (12.3), as restrições são o cilindro h\{x,yjz) =
H- j/^ = 1 e o plano h2{x,y,z) = x + z = 1. Estas duas superfícies se
12.2 Otimização com várias restrições em igualdade 483

interceptam ‘‘transversalmente” , gerando uma elipse.


4. Agora, se não existem multiplicadores Ai e A2 para os quais

V /( p ) = A i-V /ii(p ) + A 2-V /i2(p),

isto significa que o vetor gradiente V /( p ) não está no plano gerado pelos
vetores V /ii(p ) e V /i 2(p)- Se “caminharmos” na direção do vetor gra­
diente V /( p ) , certamente 0 valor da função aumentará, mas corremos o
risco de sairmos do conjunto admissível. Contudo, como o vetor gradiente
V /( p ) não está no plano gerado pelos vetores gradientes V /ii(p ) e V /i 2(p)
das funções restrições, se “caminharmos” ao longo da curva formada pelo
conjunto admissível, a partir do ponto p, ainda assim o valor da função
aumentará ou diminuirá conforme seguimos numa ou noutra direção.
Um pouco mais formalmente, se o vetor gradiente V /( p ) não está no plano
gerado pelos vetores gradientes V /ii(p ) e V /i 2(p) das funções restrições,
então a derivada direcional de / no ponto p na direção do vetor tangente
à curva formada pelo conjunto admissível é diferente de zero. Se esta
derivada direcional for positiva, se “caminharmos” na direção do vetor
tangente, o valor da função aumentará e, se “caminharmos” na direção
oposta do vetor tangente, o valor da função diminuirá. Caso a derivada
direcional seja negativa, ocorre o contrário. Em qualquer um dos dois
casos, p não é um extremo local de / com as restrições hi = ci e h2 = C2.
Por exemplo, no exercício resolvido (12.3), é fácil ver que o ponto p =
(0, —1,1) é admissível. Contudo, como

V /(p ) = (-1 ,0 ,0 ), V/ii(p) = (0, -2 ,0 ) e V/I2(p) = (1,0,1),

segue-se que V /(p ) não está no plano gerado pelos vetores V/ii(p) e
V/i2(p). Com isto, se “caminharmos” ao longo da elipse, a partir do
ponto p = (0, —1,1), o valor da função aumentará se entrarmos no terceiro
octante (região do onde x < 0 ^ y < 0 e z > 0 ) e diminuirá se entrarmos
no quarto octante (região do onde x > 0 , y < 0 e z > 0 ) . Assim,
p = (0, —1,1) não é um extremo local de f{x^y,z) = xyz sujeito às
restrições hi{x, y, z) = x"^ + y"^ = 1 e h2{x, y^z) = x + z = 1. Observe que
o vetor V /(p ) não está no plano gerado pelos vetores V/ii(p) e V/i2(p),
isto é, não existem multiplicadores Ai e A2 para os quais

V /( p ) = A i.V /ii(p ) + A 2-V /i2(p).


484 Otimização com restrições

Desta maneira, p = (0, —1,1) não satisfaz as condições de primeira ordem.


Observe também que p satisfaz a condição de regularidade pois a matriz
jacobiana

0-2 0

V /i2 ( 0 ,-l,l) 1 0 1
j 2x3 -I 2x3

tem posto 2.

Figura 12.7: O ponto p = (0, —1,1) não é um extremo local da função


f { x , y, z) = x y z sujeito às restrições h\{x, y^z) = x “
^ y'^ = 1 e
h 2{x , yj z) = x-{-z = 1. Observe que o vetor V/(p) não está no
plano gerado pelos vetores V/ii(p) e V/i2(p).
12.3 Otimização com uma restrição em desigualdade 485

O bservação. Novamente, a condição de regularidade não pode ser omitida


no teorema dos multiplicadores de Lagrange. Como antes, para omití-la, é
necessário acrescentar um multiplicador para a função-objetivo.

T eo rem a 12.5 (F ritz J oh n ) Sejam / , hi, , . . , hm funções de


classe <7^ de n variáveis e seja p ura extremo (máximo ou mínimo)
local de / no conjunto admissível

D = { x e K" I /ii(x ) = Cl,. . , , /i«(x) = c^}.

Então existem multiplicadores Ag, , AJ^ tais que

A S-v./(p) = a i - v M p ) + " - + a^ - v M p ),

ánx(p) = Cm,
(A$,AÍ,...,A^) ^ (0,0, ..,0 ),
................
A condição (Ao,A|, ,AJ^) ^ (0,0, ,,0) diz que os multiplicadore||:f
Aq, AJ, . . . , A^ não são simultaneamente nulos.

Evidentemente, a situação desejável é que Ag = 1, pois caso contrário, a


função-objetivo desapareceria completamente das condições de primeira or­
dem. A hipótese de regularidade garante que podemos tomar Ag igual a 1
no teorema de Fritz John.

12.3 Otim ização com um a restrição em desigualdade

Nas duas seções anteriores estudamos problemas de otimização nos quais


0 conjunto admissível é construído como a interseção de várias “hiperfícies”
de nível, isto é, com o uso de igualdades:

= { x e M" I á i(x ) = Cl, . . . , ám(x) = Cm }.

Para encontrar os candidatos a pontos de máximo ou pontos de mínimo de


uma dada função-objetivo, em um tal conjunto admissível, vimos que basta
486 Otimização com restrições

calcular os pontos críticos do lagrangeano correspondente, não esquecendo


de verificar a condição de regularidade. Contudo, a grande maioria dos
problemas de otimização em engenharia e economia são modelados de tal
forma que o conjunto admissível é construído com o uso de desigualdades:

D = {x e E ” I 5i(x) < 6i , . . . , 5fc(x) < bk}.

A partir de agora, construiremos a teoria necessária para caracterizar algebri-


camente os candidatos a extremo de uma função em um conjunto admissível
deste tipo. Vamos começar com um caso bem simples:

maximizar f{Xl,X 2)
sujeito a (xi, X2) G -D = {(a:i, X2) G I g{xi,X2) < b}.

Suponha que p seja solução do problema de otimização, isto é, suponha que


p G D seja um ponto de máximo de / no conjunto admissível D. Temos
duas possibilidades: ^(p) = ò ou ^(p) < b.

1. Caso g{p) = b.
Nesta situação, dizemos que a restrição g está ativa no ponto p. Ge­
ometricamente, isto significa dizer que o ponto p está na fronteira do
conjunto admissível (veja a figura (12.8)). Observe que, aqui, estamos em
uma situação semelhante ao caso de uma única restrição em igualdade.
Desta maneira, se p é ponto de máximo local de / em Z), então vale a
mesma conclusão do teorema dos multiplicadores de Lagrange, isto é, os
gradientes de f e g no ponto p são paralelos:

V /(p ) = M* • V5(p).

Mas, agora, vale uma condição extra:

/x*>0,

isto é, 0 multiplicador /i* deve ser maior ou igual a zero. Vamos justificar
este fato com argumentos geométricos. Considere a figura (12,8). Se p é
máximo local de / em D, então as curvas de nível de / em uma vizinhança
de p devem ser tais que

Cl < C2 < C3 < C4.


12.3 Otimização com uma restrição em desigualdade 487

Figura 12.8: Caso em que a restrição g está ativa na solução p do problem a


de otimização.

Desta maneira, o vetor gradiente de / em p deve apontar para ‘‘fora”


do conjunto admissível (lembre-se que o gradiente de uma função, quando
não-nulo, fornece a direção de maior crescimento da função no ponto). Por
outro lado, o vetor gradiente de g em p também deve apontar para “fora”
da região, uma vez que g[Y>) = b e, “fora” da região, o valor da função é
maior do que h. Moral da história: os vetores V /( p ) e V í(p ) possuem
a mesma direção e o mesmo sentido, sendo assim, V /( p ) = /i* • V ^(p),
com 11* > 0. Evidentemente, devemos ter o mesmo cuidado que tivemos
no caso de uma única restrição em igualdade: o ponto p deve satisfazer a
condição de regularidade, isto é, o ponto p deve ser tal que ^g{p) 7^ 0 .

2. Caso ^(p) < b.


Nesta situação, dizemos que a restrição g não está ativa no ponto p.
Geometricamente, isto significa dizer que o ponto p está no interior do
conjunto admissível (veja a figura (12.9)). Observe que, aqui, estamos
em uma situação semelhante à que estudamos no capítulo 11, onde pro­
curávamos por extremos sem restrições, isto é, extremos no interior do
conjunto admissível. Desta maneira, se p é um ponto de máximo local
de / em Z), então p deve satisfazer a regra de Fermat:
488 Otimização com restrições

Figura 12.9: Caso em que a restrição g não está ativa na solução p do pro­
blem a de otimização.

v/(p ) = 0,

isto éj p deve ser um ponto crítico de / . Observe que, na figura (12.9),


os vetores gradientes V /(q ) e V^(q) são paralelos mas possuem sentidos
opostos^ isto é, V /(q ) = p* • V5(q) mas com /i* < 0. O ponto q não é
máximo local de / no conjunto admissível D pois se, a partir do ponto q,
‘‘caminharmos” na direção do vetor gradiente V /(q ), continuaremos den­
tro do conjunto admissível e o valor da função / aumentará.

Resumindo: se p é um extremo local de / em Z), então ou g(p) = 6 ou


g{p) < 6, isto é, a restrição g ou está ou não está ativa no ponto p. Se g
está ativa no ponto p, então vale que

v/(p ) = Ai*-V5(p),
//* > 0,
5(p) = b,
12.3 Otimização com uma restrição em desigualdade 489

lembrando que, neste caso, supõe-se que p satisfaz a condição de regulari­


dade, isto é, supõe-se que Vp(p) ^ 0 . Por outro lado, se a restrição g não
está ativa no ponto p, então vale que

r v / ( p ) = 0,
I 5(P) <
Existe uma maneira de se unificar estes dois casos, seguindo uma idéia
bem simples, devida a Karush-Kuhn-Tucker: basta considerar o sistema

v/(p ) =
H* ■[í^(p) - 6] = 0,
Ai* > 0,
ff(p) < b.
A “esperteza” aqui está na segunda linha do sistema:

Ai* • [í?(p) - b ] = 0 .

De fato, se /j,* • [^(p) —6] = 0, então //* = 0 ou ^(p) = 6. Se ii* = 0, então


V /(p ) = /i* • Vg(p) = 0 • V5(p) = 0 , isto é, p é um ponto crítico de /
(segundo caso). Por outro lado, se fi* > 0, então ^(p) = 6 (a restrição g está
ativa em p) e, portanto, vale que V /(p ) = /x* • V5(p), com /x* > 0 (primeiro
caso). Observe que se /x* = 0 e g{p) = 6, então estamos considerando o
caso particular em que / possui um ponto crítico na fronteira do conjunto
admissível. Novamente, no caso j(p ) = 6, devemos impor a condição de
regularidade: Vg{p) ^ 0 . Vamos resumir todas estas idéias no próximo
teorema.

;:(:||éb|Íra|t|l:2v0ÍÍSÍj'ÍÍI|!É

' ■süj eito a :, '(ii, í 2) €

|Supb|i;|iÍ;;;güé;:;p>S|||)|||>2|iÍP
||Í';Í;^;|ê||riçãb;:||ásta|||^
490 Otimização com restrições

Então existe um número real fi* tal que (p,/^*) = {pi:P2yl^*) satisfaz
as condições de pnmeira ordem
V /(p ) =
fi* l9{v)-b] = 0,

Este sistema também pode ser escrito, de maneira equivalente, ertlj


termos do lagrangeano
L{xi, X2 , p) = f{xi , ícz) - p ■[g{xu X2) ~ b],
da seguinte maneira.

^ ( P i,P 2 ,p )

= 0,
p* • b (p i,P 2) - 6] = 0,

_________________
Observe que a condição fffpi.pa) < b é equivalente à condição
{dL/dfj,){pi,p2,fi*)>0^

Observe as semelhanças e diferenças entre 0 teorema (12.2), que trata do


problema de otimização com uma restrição em igualdade^ e o teorema (12.6),
que trata do problema de otimização com uma restrição em desigualdade:

1. Os dois teoremas usam o mesmo lagrangeano L e os dois teoremas pedem


que as derivadas parciais de L com relação ^.x\ e X2 sejam iguais a zero.
2. A condição
dL
— (xi, X2, A) = -[h{xi, X2) - c] = 0,

para a caso com uma restrição em igualdade, não vale mais quando consi­
deramos a situação com uma restrição em desigualdade pois, neste caso,
a restrição não precisa estar ativa no ponto de máximo. No lugar, usamos
as duas condições
12.3 Otimização com uma restrição em desigualdade 491

dL
H-[g{xi,X2) - b ] = 0 e -õj^{xi,X2,iJ.) = - [g{xuX 2) - b ] > 0,

sendo que esta segunda condição nada mais é do que a própria restrição
em desigualdade,
3. Os dois teoremas exigem uma condição de regularidade. Contudo, no caso
de uma restrição em desigualdade, só precisamos veriíicá-la para pontos
onde a restrição está ativa.
4. Não existem restrições para o sinal do multiplicador no caso de uma res­
trição em igualdade. Por outro lado, para o problema de maximimização
de uma função / sujeito a uma restrição em desigualdade do tipo g <
o multiplicador deve ser não-negativo.
5. Para problemas de otimização com restrições em igualdade (e mesmo pro­
blemas de otimização sem restrições), as condições de primeira ordem
funcionam tanto para problemas de maximização quanto para problemas
de minimização. Por outro lado, o argumento de que os vetores gra­
dientes V /(p ) e V^(p) possuem a mesma direção e sentido, dado na
figura (12.8), só é válido para problemas de maximização com restrições
em desigualdade do tipo g < b. Se, por exemplo, queremos minimizar uma
função / com uma restrição do tipo g <b^ então V /(p ) e Vp(p) possuem
a mesma direção mas com sentidos opostos em um ponto de mínimo p que
é regular e está na fronteira do conjunto admissível (o caso do ponto q
na figura (12.9)). Falaremos mais sobre as diferenças entre problemas de
maximização e de minimização em uma seção subseqüente.

Exercício resolvido 12.4 Resolva o seguinte problema de otimização

maximizar /(xi,X2) = xiX2


sujeito a 5(xi, X2) = x\ + x^ < l.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 1. As funções f e g são de classe como soma e multiplicação


de funções de classe C^.
• P asso 2 . Verificar a condição de regularidade.
A condição de regularidade exigida pelo teorema (12.6) diz que 0 gra­
diente de g deve ser diferente de zero em cada solução do problema de
492 Otimização com re str iç »

otimização para a qual a restrição g está ativa. Mas como verific.ir l


condição de regularidade se ainda não conhecemos a solução do ir >
blema de otimização? De fato, o que queremos é justamente encomrir
a solução (ou soluções) do problema! A idéia é mostrar que todos os
pontos do conjunto admissível para os quais a restrição g está ativa (isto
é, todos os pontos {x\^ x^) em tais que ^(xi, X2) = xl + X2 = 1) satis­
fazem a condição de regularidade! Com isto, caso exista alguma solução
do problema de otimização, certamente ela irá satisfazer a condição de
regularidade exigida pelo teorema (12.6). Se g{xi^Xx) = xj + = 1,
então Xi e X2 não podem se anular simultaneamente. Portanto, como

Vg(xi,a;2)= ( ^ ( x i , a ; 2 ) , ^ ( x i , X2) ) = ( 2 x i , 2 x 2 )

segue-se que V p(xi,X 2) / (0, 0) em todo (xi,X2) para o qual a res­


trição g está ativa.

• P asso 3. Escrever o lagrangeano.

L{xi, X2, /i) = f{xi, X2) - [g{x-í, X2) - h ] = x\X2 - g - {x\ + x l ~ 1).

• P asso 4. Escrever as condições de primeira ordem.

— (x i ,X2,m) = 0,
X2-2/XX1 = 0, (1)
X1-2/XX2 = 0, (2)
^^^( x i ,X2,m) 0,
g ■ [xl + xl - 1] = 0, (3)
Aí • b(a;i,X2) - ò] = 0, Aí > 0, (4)
Aí > 0, Xj + X2 < 1. (5)
g { x i , X 2) < b,

• P asso 5. Resolver o sistema correspondente às condições de primeira


ordem.
De (4), temos dois casos: /z = 0 ou ^ > 0. Se /z = 0, então de (1) e (2),
concluímos que 2; = 0 e y = 0. Logo, o ponto

(x i ,X2,Aí) = (0,0,0)

satisfaz as condições de primeira ordem. Por outro lado, se /a > 0 então,


de (3), segue-se que xf-|-X2 = 1. Conseqüentemente, devemos ter xi / 0.
12.3 Otimização com uma restrição em desigualdade 493

De fato: Se xi = 0 então, de (1), teríamos X2 = 0 e, portanto,


seria igual a 0 e não igual a 1. Analogamente, podemos mostrar que
X2 ^ 0. Agora, uma vez que x\ ^ 0 e X2 ^ 0^ então de (1) e (2), temos
X2
2 xi 2 X2 ^
de modo que _ l, isto é,
Logo, x^ + xl = 2 x^ =

V2 V2
X2 — --- Y X2 = +

Dado que x^ = X2, segue-se que

V2 V2
xi = OU — +

Finalmente, como = X2/ X 1 = x \ / x 2 e 0 multiplicador \x não pode ser


negativo (pela condição (4)), os pontos que satisfazem as condições de
primeira ordem, no caso /i > 0, são

2 ’ 2 ’^ 2 2 ’ 2 ’ 2

Sendo assim, apenas três pontos satisfazem as condições de primeira


ordem: (0,0,0), ( - \ / 2 / 2 , -^ 2 /2 ,+ 1 /2 ) e (+ ^ /2 /2 ,+ ^ ^ /2 ,+ 1 /2 ).
• P asso 6. Conclusão.
A função-objetivo / é contínua (pois é de classe C^) e o conjunto ad­
missível é compacto (pois é um disco de centro na origem e raio 1, veja
a figura (12.10)). Pelo teorema de Weierstrass, / possui máximos e
mínimos globais no conjunto admissível. Agora, pelo teorema (12.6),
qualquer solução do problema de otimização que estamos estudando
deve ser solução do sistema associado às condições de primeira ordem
(a condição de regularidade é fundamental aqui pois, com ela, temos a
garantia que qualquer solução do problema de otimização será também
solução do sistema associado às condições de primeira ordem para va­
lores adequados dos multiplicadores). Desta maneira, os pontos de
máximo de /(x i, X2) = x\X 2 sujeito á restrição 5(^1, X2) = x\ + x^ < I
estão entre (0, 0), (—\/2/2, —y/ 2 / 2 ) e (+ \/2 /2 ,4 -v ^/2 ). Para encontrá-
los, basta calcular a função-objetivo nestes pontos e selecionar os de
maior valor. Temos
494 Otimização com restrições

-1 ^ +1

- 1 /2 + 1 /2

- 1 / 6 --------------
ism à rn iiili — + 1 /6

Figura 12.10: Desenho das curvas de nível de / (os números indicam o valor
do nível) e do conjunto admissível (o disco de centro na origem
e raio 1). Com uma escala menor, os vetores com seta branca
indicam o gradiente de g enquanto que os vetores com seta
preta indicam o gradiente de /.

1
/(0 ,0 ) = 0, 1 , L ' ^
2 ' 2’

Conseqüentemente, os pontos

são soluções do problema de otimização, isto é, eles são pontos de


máximo global de / no conjunto admissível

D = {(aji, X2) € \ x\ + xl = 1}.

Note que, na figura (12.10), os pontos (—\/2 /2 , —•\/2/2) e ( + \/2 /2 ,+ \/2 /2 )


estão na fronteira do conjunto admissível, de modo que a restrição g está
12.4 Otimização com várias restrições em desigualdade 495

ativa nestes pontos. Uma vez que eles são soluções do problema de oti­
mização e satisfazem a condição de regularidade, segue-se que, de acordo
com o teorema (12.6), os gradientes de f e g possuem a mesma direção e
sentido nestes pontos. O ponto (0, 0) está no interior do conjunto admissível,
de modo que a restrição g não está ativa neste ponto. Note que (0, 0) não
é máximo e nem mínimo local de / em D (por que?). Agora, os pontos
(—\/2 /2 ,+ \/2 /2 ) e (H-\/2/2, —v ^/2), apesar de admissíveis, não satisfazem
as condições de primeira ordem, pois o multiplicador é negativo para estes
pontos. De fato, pode-se mostrar que eles são pontos de mínimo global de /
em D. m

O bservação. Como antes, a condição de regularidade pode ser substituída


pelo acréscimo de um multiplicador para a função-objetivo, resultando nas
condições de Fritz John. Trataremos mais sobre condições de regularidade
em uma seção subseqüente.

12.4 Otim ização com várias restrições em desigual­


dade

O teorema (12.6) generaliza-se facilmente para o caso de várias variáveis


e várias restrições. Lembre-se que uma restrição ^(x) < h está ativa em um
ponto p se ^(p) = 6. Se p(p) < 6, então dizemos que a restrição não está
ativa em p.

T eorem a 12:7 Sejam f , g i , , funções de classe de n variáveis


defimdas em um aberto de M” e seja p € E” um máximo local de / no
conjunto adimssível

r» = {x 1 ffi(x) < hl, . ., 5fe(x), < h } ,


onde X = { x \ , . , a;„) Caso alguma restrição esteja ativa em p^ va­
mos renomeá-las de forma que elas sejam as I primeiras: gi, , gi.
Suponha que p satisfaça a seguinte condição de regularidade: o posto
da matriz jacobiana
496 Otimização com restrições

dgi
V5i(p)
ÕXn (P)

dgi ( . àgi
LãíI^P) '• (P)
dxn - Ixn

é igual a I (o número de restrições ativas em p). Então existem mul­


tiplicadores jj,*, tais que

V /(p ) = • Vpi{p) + •' • + • V 5fc(p),


M • [^ i(p )- *i] = Oi

[Sfe(p)-&Jk] = 0,

, ' Íú(p) <■ K

ah{p) < h ,

ou, equivalentemente,

dL. ,,
= 0,
■■^ y '>‘ )
t 4 - \ 9 i { p ) - h ] = 0,

/“ife‘ bfc(p)-^É] = 0,

5i(p ) < h ,

9k{p) < h i ■

onde>* = (p i,. e L é o lagrangeanot


12.4 Otimização com várias restrições em desigualdade 497

m) = /( x ) - Ml • [gi(x) - 6x] • m ■ [5üt(x) - bk].

Estes sistemas são denominados de condtçôes de pnmeira ordem para


0 ponto de máximo (lòcal) p.

A condição de regularidade do teorema (12.7) é a generalização natural das


condições de regularidade dos teoremas (12.4) e (12,6). Esta condição envolve
apenas as restrições que estão ativas, uma vez que restrições que não estão
ativas não desempenham nenhum papel nas condições de primeira ordem.
Sendo assim, com relação à condição de regularidade, tratamos as restrições
ativas do mesmo modo que tratamos as restrições em igualdade: o posto
da matriz jacobiana formada pelos gradientes das restrições ativas deve ser
máximo.

Exercício resolvido 12.5 Resolva o problema de otimização que consiste


em

maximizar x y z

sujeito a X + y + z < 1 ,

X > 0,
í/ > 0,
z > 0.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 0. Escrever o problema na forma-padrão.


Para aplicarmos o teorema (12.7), devemos ter um problema de m a x i ­
m i z a ç ã o com t o d a s as restrições em desigualdade na forma <. Caso al­

guma restrição seja da forma >, é muito fácil convertê-la para a forma <:
basta multiplicá-la por —1. Fazendo isto, n ã o alteramos o conjunto ad­
missível e podemos usar as condições de primeira ordem do teorema.
Assim, na forma-padrão, temos

maximizar f { x , y , z ) = xyz
sujeito a gi{x,y,z) = X + y + 2 < 0,
92{x,y,z) = —X < 1,
9z{x,y,z) = - y < 0,
9A{x,y,z) = - z < 0.
498 Otimização com restrições

P asso 1. As funções f e g são de classe como soma e multiplicação


de funções de classe C^.

P asso 2. Verificar a condição de regularidade.


A condição de regularidade exigida pelo teorema (12.7) diz que o posto
da matriz formada pelos vetores gradientes das restrições que estão ati­
vas na solução do problema deve ser máximo. Mas como verificar a
condição de regularidade se ainda não conhecemos a solução do pro­
blema de otimização? De fato, o que queremos é justamente encontrar
a solução (ou soluções) do problema! A idéia é mostrar que todos os
pontos do conjunto admissível satisfazem a condição de regularidade!
Evidentemente, dependendo do ponto, podemos ter apenas uma res­
trição ativa, apenas duas restrições ativas e assim por diante. Em cada
caso, devemos mostrar que o posto da matriz é igual ao número de
restrições ativas. Com isto, caso exista alguma solução do problema
de otimização, certamente ela irá satisfazer a condição de regularidade
exigida pelo teorema (12.7).
Primeiro, vamos representar geometricamente o conjunto admissível.
As restrições x > 0 , y > 0 e 2 ; > 0 dizem que estamos no primeiro
octante enquanto que a restrição x-\-y+z < 1 diz que, ao mesmo tempo,
devemos estar abaixo do plano que passa pelos pontos (1,0,0), (0,1,0) e
(0, 0,1). Desta maneira, é fácil ver que o conjunto admissível é formado
pelo tetraedro sólido cujos vértices são Vi = (0,0,0), V2 = (1,0,0),
V3 = ( 0 , 1 , 0 ) e V4 = ( 0 , 0 , 1 ) .

Uma vez que temos o desenho do conjunto admissível, é fácil identificar


geometricamente os pontos com apenas uma restrição ativa, apenas duas
restrições ativas e assim por diante. Por exemplo, dizer que apenas a
restrição gi está ativa em um ponto (x, ?/, z) significa dizer que o ponto
está no interior da face triangular com vértices V2, V3 e V4. Por outro
lado, os pontos no interior do segmento que une os vértices V2 e V3
possuem apenas duas restrições ativas: 5 1 e 5 4 . O vértice V 4 é o único
ponto onde apenas as restrições 51, p2 ^ 93 estão ativas. Moral da
história: para o tetraedro, nos vértices temos apenas três restrições
ativas, nos pontos das arestas (que não são vértices) temos apenas duas
restrições ativas e nos pontos das faces (que não são vértices e não estão
nas arestas) temos apenas uma única restrição ativa. Pontos do interior
do tetraedro correspondem a pontos onde nenhuma restrição está ativa.
12.4 Otimização com várias restrições em desigualdade 499

Figura 12.11: Conjunto admissível para o exercício resolvido (12.4).

Vamos agora mostrar que todos os pontos do conjunto admissível satis­


fazem a condição de regularidade, de acordo com os vários casos.

1. Uma restrição ativa apenas: temos quatro casos.


(a) Se 5i(x,2/,z) = 1 então
Vgi(a^,y,^)~|] = [ 1 1 1
tem posto 1.
(b) Se g2{x, y,z) = 0 então
Vg2{x,y,z) - 1 0 0
tem posto 1.
(c) Se g3{x, y,z) = 0 então
"^g3{x,y, z) = [ 0 -1 o]
tem posto 1.
(d) Se 34(x , y^z) = 0 então
Vgj {x , y , z) ~\ ^ = [ 0 0 -1 ]
tem posto 1.
500 O tim ização com restrições

2. Duas restrições ativas apenas: temos seis casos,

(a) Se gi(x, y,z) = 1 e g2{x, y, z) = 0, então

1 1 1 1 1 1

Vg 2 {x,y,z) - 1 0 0 0 1 1
tem posto 2.
(b) Se gi{x, y,z) = l e gi{x, y, z) = 0, então

Vgi (x, y, z) 1 1 1

Vgs(x,y,z) 0 -1 0

tem posto 2.
(c) Se gi(x, y,z) = 1 e g4(x, y, z) = 0, então

Vgi (x, y, z) 1 1 1

Vg4x,y,z) 0 0 -1

tem posto 2.
(d) Se g2 (x, y,z) - 0 e g^x, y, z) = 0, então

'^ 92{x,y,z) - 1 0 0
V 93{x,y, z) 0-1 0

tem posto 2.
(e) Se g2{x, y,z) = 0 e g^x, y, z) = 0, então

Vg 2{x,y,z) - 1 0 0
Vg 4 x, y, z) 0 0-1

tem posto 2.
(f) Se g3{x,y,z) = 1 e g4 x ,y ,z ) = 0, então

Vg3Íx,y,z) 0 -1 0

Vg 4 x,y, z) 0 0 -1

tem posto 2.
12.4 Otimização com várias restrições em desigualdade 501

3. Três restrições ativas apenas: temos quatro casos.

(a) Se gi{x, y, z) = 1, g2{x, y,z) = 0 e gz{x, y, z) = 0, então

V g i{x,y,z ) 1 1 1 1 1 1

'^ 92Íx,y, z) - 1 0 0 r\j 0 1 1

Vgz{x,y, z) 0-1 0 0 0 1

tem posto 3.

=: 0, então

V g\{x,y, z) 1 1 1 1 1 1

Vg2{x, y, z) - 1 0 0 0 1 1
S/giix, y, z) 0 0-1 0 0 -1

tem posto 3.

(c) Se g i{x,y,z ) = 1, gz{x,y,z) = 0 e g i{x,y,z) = 0, então

V g i{x,y, z) 1 1 1

Vgz{x,y, z) 0 -1 0

Vg4{x,y, z) 0 0 -1

tem posto 3.

(d) Se g2{x,y,z) = 1, gz{x,y,z) = 0 e g4{x,y,z) = 0, então

^92{x,y, z) - 1 0 0
'^93{x,y,z) 0 -1 0
Vg 4{x,y,z) 0 0 -1

tem posto 3.
502 Otimização com restrições

4. Quatro restrições ativas: não temos caso algum pois não existem
pontos com quatro restrições ativas. Para vê-lo, basta observar que
se g i{x ,y,z ) = 1, g2{x,y,z) = 0, gz{x,y,z) = 0 e g4{x,y,z) = 0,
para algum ponto (x, y, z), então teríamos x = 0^ y = 0 e z = 0, de
modo que x-\-y-\-z = 0 = 1, um absurdo.
Passo 3 . Escrever o lagrangeano.

L{x, y, z, m, fj, 2,fJ,3,fM) = f { x , y , z ) - fii ■[gi{x,y,z) - bi]


- l^'2 - [92{x,y,z) - Ò 2]
- fJ'Z- [93{x,y,z) -bz]
- yL4-[94{x,y,z) -b4\
— xyz - m { x + y + z - l)
+ ij,2 x + Hz y + Ha z.
as condições de primeira ordem.
Temos
9L,
-õ^[x,y, z, Hl, H2, H3, I^A) 0,
ÕL,
— [x,y,z,Hi,H2,H3,IJ'A) —
0,
dL,
— {x,y,z,Hi,H2,H3, M 0,
Ml •[9i{x,y,z) - 6i] = 0,
9 2 -[92Íx,y,z) - b 2] = 0,
M3 •[93{x,y,z) - Ò3] = 0,
H a ■[9a{x ,y, z) - 64] = 0,
Ml > 0,
M2 > 0,
M3 > 0,
Ha > 0,
9i{x,y,z) < hl,
92{x,y,z) < h2.
93{x,y,z) < hz.
9A{x,y,z) < 64.
Calculando as derivadas parciais do lagrangeano com relação a. x, y e
obtemos o seguinte sistema
12.4 Otimização com várias restrições em desigualdade 503

yz —/Xl H- /X2 — 0, (1)


xz —Ml + — 0, (2)
xy ~ Ml + M4 = 0, (3)
/Xi [x + y + z - l ] = 0, (4)
112 X = 0, (5)
1^3y = 0, (6)
114 z = 0, (7)
y-i > 0, (8)
> 0, (9)
M3 > 0, (10)
M4 > 0, (11)
x +y+z < 1, (12)
X > 0, (13)
y > 0, (14)
z > 0. (15)

• P asso 5. Resolver o sistema correspondente às condições de primeira


ordem.
Das condições (1), (2) e (3) temos

fii = yz + fi2 = xz + = xy + /i4.

De (8), temos dois casos: /xi = 0 ou /ii > 0.


Se /xi = 0, como todas as variáveis são maiores ou iguais a zero, por (8),
(9), (10), (11), (13), (14) e (15), segue-se que

yz = xz = xy = 0 = /^3 = M4 = 0.

Portanto, pelo menos duas entre as três variáveis x^ y e z devem ser


iguais a zero. Por outro lado, como x + y + z < por (12), concluímos
que a variável restante deve estar entre 0 e 1. Sendo assim, os pontos
que satisfazem as condições de primeira ordem, neste caso, são aqueles
que estão em cada uma das três arestas que ligam (0, 0, 0) aos demais
vértices do tetraedro.
Se > 0, por (4), devemos ter x + y + z = 1. Nesta situação, x é maior
do que zero pois, se x = 0, como /xi = xz + = xy + 114^ teríamos
= /i3 = /i4 > 0 e, conseqüentemente, por (6) e (7), teríamos também
y = 0 e z = 0. Mas então x y + z seria igual a 0 e não igual a 1,
504 Otimização com restrições

uma contradição. Da mesma maneira podemos demonstrar que y > 0


e z > 0. Logo, por (5), (6) e (7), segue-se que

= Ms = M4 = 0 = y z = x z = xy.

Dividindo-se por x^ y e z (isto é possível pois x > 0 , y > 0 e z > 0 ) ,


concluímos que

x = y = z

Como X + y + z = temos x = y = z = 1/3 e fii = 1/9. Logo,

(x , y, z, 1^1, H2, fj-á) = (1/3 ,1 /3 ,1 /3 ,1 /9 ,0 ,0 , 0)

é o único ponto que satisfaz as condições de primeira ordem, neste


segundo caso.
• P asso 6 . Conclusão.
A função-objetivo / é contínua (pois é de classe C^) e o conjunto ad­
missível é compacto (veja a figura (12.11)). Pelo teorema de Weierstrass,
/ possui máximos e mínimos globais no conjunto admissível. Agora,
pelo teorema (12.7), qualquer solução do problema de otimização que
estamos estudando deve ser solução do sistema associado às condições de
primeira ordem (a condição de regularidade é fundamental aqui pois,
com ela, temos a garantia que qualquer solução do problema de oti­
mização será também solução do sistema associado às condições de pri­
meira ordem para valores adequados dos multiplicadores). Para en­
contrá-los, basta calcular a função-objetivo nestes pontos e selecionar
os de maior valor. No passo 5 vimos que os únicos pontos do conjunto
admissível que satisfazem as condições de primeira ordem, para valores
adequados dos multiplicadores, são os pontos sobre as três arestas que
ligam (0, 0, 0) aos demais vértices do tetraedro, para os quais o valor da
função / é 0, e o ponto

(1/3,1/3,1/3),

para o qual o valor de / é 1/27. Sendo assim, dentre todos os valores


de x^ y e z que satisfazem as restrições, x + y + z < l , x > 0, y > 0
e z > 0, dü escolha x = 1/3, y = 1/3 e z = 1/3 é que torna o valor da
expressão xyz o maior possível. i
12.4 Otimização com várias restrições em desigualdade 505

Como você pode observar no passo 5 deste exercício resolvido, para encon­
trar os pontos que satisfazem as condições de primeira ordem, quase sempre
temos que fazê-lo considerando-se vários casos. Por exemplo, no exercício
resolvido (12.5), a condição fJ^i > 0 gerou dois casos: /ii = 0 ou /ii > 0.
Neste processo, você deve fazer um estudo completo de cada caso, encon­
trando todos os pontos que satisfazem as relações estabelecidas {incluindo os
valores dos multiplicadores) ou mostrando que não existem soluções através
de uma contradição. Freqüentemente, casos precisam ser subdivididos em
subcasos. Por exemplo, no exercício resolvido (12.5), tivemos que considerar
os subcasos a: = 0 e a: > 0 dentro do caso pi > 0.
Mas como encontrar os pontos que satisfazem as condições de primeira
ordem em uma situação com várias variáveis e várias restrições? Certamente
o sistema resultante terá muitas condições e muitas variáveis. Por exemplo,
no problema da dieta (página 26), com funções de 9 variáveis e 13 restrições
em desigualdade, as condições de primeira ordem resultam em um sistema
com 48 condições e 22 variáveis. Neste sentido, temos duas observações.

1. Mais do que uma possível ferramenta de cálculo das soluções de um pro­


blema de otimização, as condições de primeira ordem são ferramentas úteis
na tentativa de se obter propriedades importantes do problema em estudo.
Este tipo de análise teórica é muito freqüente em Economia, Engenharia
e Matemática.
2. As condições de primeira ordem podem sugerir algoritmos que possam ser
implementados em um computador. Os métodos de ponto interior^ muito
usados e discutidos atualmente, são um exemplo disto.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Um erro muito freqüente na resolução do sistema associado às condições


de primeira ordem é o de se “dividir” uma equação por uma determi­
nada expressão sem se preocupar com o fato desta expressão ser zero ou
não. Por exemplo, no exercício resolvido (12.5), tivemos que garantir
primeiro que x é maior do que zero para concluir que y = a, partir da
equação xy = xz. Se você vai “dividir” uma equação por uma certa ex­
pressão e você não sabe se ela é igual a zero ou não, então você terá que
considerar dois casos: quando a expressão é diferente de zero e quando
a expressão é igual a zero.
506 Otimização com restrições

12.5 Otimização com restrições mistas

É fácil combinar os resultados dos teoremas (12.4) e (12.7) para obter um


teorema geral, com restrições em igualdade e em desigualdade.

T eorem a 12.8 ( de K arush -K uhn -T ucker ) Sejam / , h i, . , h ^ ,


gi, . Qk funções de classe de n variáveis definidas em um aberto
de R” e seja p 6 R” um máximo local de / no conjunto admissível

{x 1 fii(x) = c i,...,fi„ i(x ) = Cm,5i(x) < 6i,...,pí;(x) < h } ,


formado com m restrições em igualdade e k restrições em desigual­
dade, onde X = ( x i , . . . , x„). Caso alguma restrição em desigualdade
esteja ativa em p, vamos renomeá-las de forma que elas sejam as I
primeiras: gi. Suponha que p satisfaça a seguinte condição de
regularidade: o posto da matriz jacobiana
âh i , .
V/h (p )

àfhn. y

Vhmip) -

Ví?i(p)

V5/(p )
{m+l)xn > ■■■ d x j^ ^

é igual a m + 1 (o número de restrições ativas em p). Considere o


lagrangeano definido por

I-(x ,A ,p ) = /( x ) - A i-[hi(x)-ci] - \ n ' [hm(x) Cm\


^ Ml ‘ Í5i(x) - &i] - Pk ■Í5è(x ) - bk],

A — (Aj,. .) Ajn). e f í — ( ^j , . • . ,pj.).

Então existem multiplicadores A*, . . . , AJ^, /t|, . . , , tais que


12.5 Otimização com restrições mistas 507


lü ll
; / i r [5 i (p )'N 'i] = 0, ‘ •
<■ ■

|||i||iÍ|iipiÉi^
> 0,
^i(p) < h ,

|fc(p) •< % , iilii


-ou, equivâleutemente,
mtm
v /(p ) = ^ X - V h , ( p ) + ^ n l - V g i { p ) ,
i^í i=i
M p ) - Cl,

fhn{p) — Crti,
MÍ • [5l{p) - í>ll = 0,
ÍI||Íj|||||H i|H
f i l - Í9k {p ) - h ] = 0,
' m! > 0,

Mfc > 0,
í?i(p) < h ,

9k {p ) < h -

Estes sistemas são denominados de condições de primeira ordem paia


o ponto de máximo (local) p.
508 Otimização com restrições

Exercício resolvido 12.6 Resolva o problema de otimização que consiste


em

maximizar x - y"^
sujeito a a;2 + í/2 _ 4^
a; > 0,
2/ > 0.

S olução : vamos subdividir a resolução deste problema em vários passos.

• P asso 0. Escrever o problema na forma-padrão.


Para aplicarmos o teorema (12.8), devemos ter um problema de maxi­
mização com todas as restrições em desigualdade na forma <. Caso al­
guma restrição seja da forma >, é muito fácil convertê-la para a forma <:
basta multiplicá-la por —1. Fazendo isto, não alteramos o conjunto ad­
missível e podemos usar as condições de primeira ordem do teorema.
Assim, na forma-padrão, temos

maximizar f {x, y) x-y^


sujeito a h\{x^y) a;2 + ?/2 _ 4^
9i{x,y) —X < 0,
92{x, y) - ? /< o .

• P asso 1. As funções f e g são de classe como soma e multiplicação


de funções de classe C^,
• P asso 2 . Verificar a condição de regularidade.
A condição de regularidade exigida pelo teorema (12.8) (teorema de
Karush-Kuhn-Tucker) diz que o posto da matriz formada pelos vetores
gradientes das restrições que estão ativas na solução do problema deve
ser máximo. Lembre-se que as restrições em igualdade estão sempre
ativas em qualquer ponto do conjunto admissível Mas como verificar
a condição de regularidade se ainda não conhecemos a solução do pro­
blema de otimização? De fato, o que queremos é justamente encontrar a
solução (ou soluções) do problema! A idéia é mostrar que todos os pon­
tos do conjunto admissível satisfazem a condição de regularidade! Evi­
dentemente, dependendo do ponto, podemos ter apenas uma restrição
ativa ou apenas duas restrições ativas. Em cada caso, devemos mostrar
12.5 Otimização com restrições mistas 509

que o posto da matriz é sempre igual ao número de restrições ativas.


Com isto, caso exista alguma solução do problema de otimização, certa­
mente ela irá satisfazer a condição de regularidade exigida pelo teorema
de Karush-Kuhn-Tucker. Vamos agora mostrar que todos os pontos do
conjunto admissível satisfazem a condição de regularidade, de acordo
com os vários casos.

1. Uma restrição ativa apenas: temos o único caso.


(a) Se hi{x^y) = 4, então
’V hi{x,y) 2x 2y j
tem posto 1 pois se hi{x^y) = = 4, então x e y não
podem anular-se simultaneamente.
Lembre-se que a restrição em igualdade hi{x^y) = 4 está sempre
ativa. Desta maneira, não existem pontos do conjunto admissível
onde a restrição < 0 ou a restrição ^2 < 0 seja a única restrição
ativa. Por este motivo, não se deve considerar estes casos no estudo
da condição de regularidade.
2. Duas restrições ativas apenas: temos dois casos.
(a) Se /ii(x, y) = A e 5i(x, y) = 0, então = 4 e x = 0. Como
y > 0, segue-se que o único ponto do conjunto admissível com
estas duas restrições ativas é o ponto (0,2). Sendo assim, a
matriz
V/ii(0,2) 0 -1
V5 i (0,2) -1 0
tem posto 2.
(b) Se h\{x,y) = 4 e g2 {x,y) — 0, então = 4 e y = 0. Como
a; > 0, segue-se que o único ponto do conjunto admissível com
estas duas restrições ativas é o ponto (2,0). Sendo assim, a
matriz
V/ii(2,0) 4 0
V52(2,0) 0 -1
tem posto 2.
510 Otimização com restrições

3. Três restrições ativas: não temos caso algum pois não existem pon­
tos com três restrições ativas. Para vê-lo, basta observar que se
h\{x,y) = 4, gi[x,y) = 0 e gi{x,y) = 0, para algum ponto (x,y),
então teríamos x = 0 e y = 0, de modo que = 0 = 4, um
absurdo.
• P asso 3. Escrever o lagrangeano.

L(x,y,A,/ii,ya2) = f { x , y ) - X i - [ h i { x , y ) - C i ]
- fJ’1 ■[gi{x,y) - h]
- /^2 • [52(2:, y) - 62]
= X - y^ - Al (x^ + y2 - 4) + X + /í2 V-

• P asso 4. Escrever as condições de primeira ordem.


Temos

— {x, y, Xi , m, f i 2) = 0,
dL. \ n
— (x,y, Ai,/ii,/i2) = 0,
h\{x,y) = Cl
Ml • [5i(a:,y)-òi] = 0,
M2-[y2(2:,y)-62] = 0,
Ml > 0,
M2 > 0,
9i{x,y) < òi,
92{x,y) < 62.

Calculando as derivadas parciais do lagrangeano com relação a x e y,


obtemos o seguinte sistema

1 —2 Al X + = 0,
Hl (1)
- 2 y - 2 Al y + /i2 = 0, (2)
x ^ + y^ = 4, (3)
M ix = 0, (4)
9'2y = 0, (5)
Ml > 0. M2 > 0, (6)
X > 0, y > 0. (7)
12.5 Otimização com restrições mistas 511

• P asso 5. Resolver o sistema correspondente às condições de primeira


ordem.
De (1) temos 1 + /xi = 2 Xix. Como, por (6), fii > 0, segue-se que
2 X ix > 0. Dado que, por (7), 2: > 0, concluímos que Ai > 0 e x > 0.
Sendo assim, por (4), temos

Ml = 0.

De (2) temos 2^ (1 + Ai) = /i2- Logo, se M2 > 0, então 1/ > 0 e, portanto,


//2y > 0, o que contradiz (5). Desta maneira,

M2 = 0 e y = 112/(2 (1 + Ai)) = 0.

Por (3) e (7) temos

X= 2 e Al - (1 + Mi ) /( 2 x) = 1/4.

Desta maneira, 0 único ponto que satisfaz as condições de primeira


ordem é

(x, y, Al, ^1, H2) = (2,0,1/4,0,0).

• P asso 6 . Conclusão.
A função-objetivo / é contínua (pois é de classe C^) e o conjunto ad­
missível é compacto (veja a figura (12.12)).

Figura 12.12: Conjunto admissível para o exercício resolvido (12.6).


512 Otimização com restrições

Pelo teorema de Weierstrass, / possui máximos e mínimos globais no


conjunto admissível. Agora, pelo teorema de Karush-Kuhn-Tucker,
qualquer solução do problema de otimização que estamos estudando
deve ser solução do sistema associado às condições de primeira ordem
(a condição de regularidade é fundamental aqui pois, com ela, temos a
garantia que qualquer solução do problema de otimização será também
solução do sistema associado às condições de primeira ordem para valo­
res adequados dos multiplicadores). Para encontrá-los, basta calcular a
função-objetivo nestes pontos e selecionar os de maior valor. Portanto,
como existe um único ponto que satisfaz as condições de primeira, ele é
a solução do problema de otimização, isto é, dentre todos os valores de
X e y que satisfazem as restrições, x^ + = 4, x > 0 e y > 0, ã escolha
x = 2 e y = 0 é â que torna o valor da expressão x —y‘^ o maior possível.

O bservação. Os teoremas (12.1), (12.2), (12.3), (12.4), (12.6) e (12.7) são


casos particulares do teorema de Karush-Kuhn-Tucker.

12.6 A lternativas para a condição de regularidade

A condição de regularidade do teorema de Karush-Kuhn-Tucker nos for­


nece a garantia de que qualquer solução do problema de otimização será
recuperada quando resolvemos o sistema associado às condições de primeira
ordem. Evidentemente, caso algum ponto não satisfaça a condição de regula­
ridade, ele deve ser incluído como um candidato em potencial para a solução
do problema de otimização. Dito de outra forma, se no passo 2 você des­
cobriu que algum ponto admissível não satisfaz a condição de regularidade,
você deve incluí-lo no passo 6, junto com os pontos obtidos no passo 5.
Como vimos, para omitirmos a condição de regularidade, basta incluir
um multiplicador para a função-objetivo. Esta idéia, devida a Fritz John, é
dada no próximo teorema em sua forma mais geral.

|||||Í |||||||||||||J
líilliiilpililliiifíiii
iiii
12.6 Alternativas para a condição de regularidade 513

formado com m restrições em igualdade e k restrições em désiguáldade,


onde X = {xi, . , Xn)- Então existem multiplicadores Xq, A|, .. , A^,

A S -v /(p ) = l ^ A : . v / í i ( p ) + 2 ^ r '^ ^ í - ( p ) ’

^^(p) —
l4 ‘ [9i {p ) - h ] = 0,

4 * k ( p ) - M = 0i
MÍ ^ Oj

K > 0.
51(p) < ^1,

iX^,Xl,...,Xl,lj.l,...,fj.l) f {0, 0, . . . , 0, 0, . . . , 0),


i iiiis i i i i a i i i s « a i »
Estes sistemas são denominados de conáípdes àt primeira ordem de
Fritz John para o ponto de máximo (local) p. .

Observe que quando Ag = 1, as condições de primeira ordem de Fritz John são


as mesmas condições de primeira ordem do teorema de Karush-Kuhn-Tucker.
Claramente, é preferível uma situação onde Ag = 1 pois, caso contrário, a
função-objetivo desaparece completamente das condições de primeira ordem.
Uma maneira de garantir que Ag seja igual a 1 no teorema de Fritz John,
é o de exigir que o posto da matriz formada pelos gradientes das restrições
que estejam ativas na solução do problema de otimização seja máximo. Uma
outra alternativa é dada no próximo teorema.

T eorem a 12.10 Se ..., são funções lineares e , PA? são


funções côncavas, então Ag = 1 no teorema de Fritz John.
514 O tim ização com restrições

A demonstração deste teorema é uma aplicação do lema de Farkas, que não


faremos aqui. Para ver uma aplicação deste teorema, considere o exercício
resolvido (12.5). Todas as funções-restrições deste exercício são lineares. O
teorema (12.10) então nos permite omitir o passo 2 na resolução do exercício
e, mesmo assim, podemos concluir que a solução do problema de otimização
está entre os pontos que resolvem as condições de primeira ordem, obtidos
no passo 5.

12.7 Problem as de m inimização

O teorema (12.8) (de Karush-Kuhn-Tucker) só pode ser aplicado em pro­


blemas de m a x im iza çã o onde as restrições em desigualdade devem estar na
forma <. Vamos ver que, de fato, basta considerar este caso, pois qualquer
problema de otimização pode ser convertido para esta forma-padrão. Por
exemplo, já vimos que, se alguma restrição em desigualdade é do tipo >,
basta multiplicá-la por —1 e teremos uma restrição da forma <, uma modi­
ficação que não altera o conjunto admissível.
Mas como converter problemas de minimização em problemas de maxi­
mização? A resposta a esta pergunta foi dada no exercício [12] da página 361.
Lá, vimos que p é um ponto de mínimo de uma função / em um conjunto
admissível D se, e somente se, p é um ponto de máximo da função —/ no
mesmo conjunto admissível. Assim, para resolver um problema de mini­
mização, basta resolver um problema de maximização trocando-se a função-
objetivo / original por —/ . Por exemplo, para se resolver o problema de
minimização

minimizar 2y —
sujeito a -\-y^ < 1,
a; > 0,
2/ > 0,

basta resolver o problema de maximização

maximizar —2 y + x^
sujeito a + y'^ < 1,
- X < 0,
-y < o ,
12.8 Condições de segunda ordem* 515

com 0 teorema de Karush-Kuhn-Tucker. Outra alternativa para se minimizar


uma função, com restrições em desigualdade da forma <, é a de se manter
a mesma função-objetivo mas, na construção do lagrangeano, usar o sinal
de + no lugar do sinal de — para os termos associados às desigualdades.

12.8 C ondições de segunda ordem*

Da mesma maneira que, nos problemas de otimização sem restrições que


estudamos no capítulo 11, desenvolvemos ferramentas para classificar pon­
tos críticos, vamos agora estabelecer teoremas que permitam classificar as
soluções das condições de primeira ordem como máximo local, mínimo local
ou nenhum dos dois.

C o n d içõ es d e se g u n d a ord em para o tim iza çã o com r e str iç õ e s em


ig u a ld a d e

Sejam / , /ii, . •., funções de classe definidas em e p um ponto


para o qual existem números reais A*, . . . , que satisfazem as condições
de primeira ordem

V /( p ) = \ \ - V h , { p ) + --- + \ l - V h m { p ) .
hi{p) = Cl,

^m(p) — Cm-

Defina h(x) = (à i(x ),. . . , /i^(x)), o lagrangeano

Z/(x, A) / (^) '^1 * ^l] *’ ' Qti]*

e a matriz hessiana orlada

d^L
dx\dxn
D lL {p ,\* ) =
d^L d^L
( p ,V ) ( p ,V )
dxndxi
516 O tim ização com restrições

Considere também

O m xm Dh{p)
ií(p ,A ) =
D h { p f D lL{p,X)
( n + m ) X (n+77i)

onde Omxm é a matriz nula m x m e Dh{p) é a matriz jacobiana de h em p


de tamanho m x m. Se

Z) = { x € R" I /li(x ) = Cl, . . . , /lm(x) = Cm] ,

temos os casos abaixo.

(a) Se para todo v ^ 0 com D h(p) • v = 0 tem-se que

Q(v) = • DlL{p, A*) • V < 0,

então p é um ponto de máximo local de / no conjunto admissível D.


A fim de que isto ocorra, é suficiente que d et(ií(p, A)) tenha o mesmo
sinal de (—1)” e os últimos n —m menores principais líderes de ií(p , A)
alternem de sinal.

(b) Se para todo v 7^ 0 com i?h(p) • v = 0 tem-se que

Q(v) = • D lL { p , A*) • V > 0,

então p é um ponto de mínimo local de / no conjunto admissível D. A


fim de que isto ocorra, é suficiente que det(ií(p. A)) e os últimos n —m
menores principais líderes de ií(p . A) tenham o sinal de (—1)’".
(c) Se existem vetores vi 0 e V2 0 tais que £>h(vi) = 0, £>h(v2) = 0 ,

Q(vi) = v [ • DlL{p, A*) • vi < 0 e Q{v 2) = • DlL{p, \*) • V2 > 0,

então p não é máximo local e nem mínimo local de / no conjunto ad­


missível D, A fim de que isto ocorra, é suficiente que as condições (a) e
(b) acima sejam violadas por alguns menores principais líderes não-nulos.

Exem plo 12.1 No exercício resolvido (12.2), estudamos o problema de oti­


mização que consiste em
12.8 Condições de segunda ordem* 517

maximizar f X 2^
sujeito a (2:1, X2) ^ D = {(xi, X2) G | h{xi^ X2) = 2x1 + xl = ^}*

Vimos que todos os pontos do conjunto admissível satisfazem a condição de


regularidade, que o lagrangeano para o problema é

L{ xi ,X2, A) = f{xi, X2) - X - [h{xi, X2) - c] = xfx2 - X ■(2x^ + X2 - 3 ),

e que os únicos pontos (a;i,2:2, A) que satisfazem as condições de primeira


ordem são

(-l,+ l,+ l/2 ), (+ l,+ l,+ l/2 ), (-1,-1,-1/2), (+ 1,-1,-1/2),


(0 ,-V 3 ,0 ), e (0,+V 3,0).

Usando o teorema de Weierstrass, sabíamos que o problema de otimização


possuía solução. Avaliando a função-objetivo nos únicos candidatos a ex­
tremo, descobrimos que

( - 1 ,- 1 ) e (+ 1 ,-1 ),

são pontos de mínimo global e que

(-1 ,+ 1 ) e (-h l,+ l)

são pontos de máximo global de / em D. Mas o que dizer dos pontos


(0, —\/3) e (0, +\/3)? Lembre-se que nem todo ponto que satisfaz as condi­
ções de primeira ordem é um extremo local de f em D.
Para classificar os pontos (0,—\/3) e (0,+\/3) vamos usar as condições
de segunda ordem. A matriz hessiana orlada do problema é dada por

dh , , dh , .
0 ^ ( x .,X2,A) — (xi,X2, A)
0x 2
dh ÕL , dL .
H{ x i ,X2,X) =
dh , . ÕL , dL ,

isto é.
518 Otim ização com restrições

0 4 2:1 2 2:2
H{ xi ,X2,X) = 4xi 2 x 2 — 4: X 22:1
2^2 22:1 —2A

Neste problema de otimização temos n = 2 variáveis e m = 1 restrição,


de modo que n — m = 1. Pelas condições de segunda ordem, precisa­
mos verificar o sinal de apenas 1 determinante, a saber, 0 determinante
de i í (2:1, 2:2, A). Se d e t(ií(2;i, 2:2, A)) possui 0 mesmo sinal de (—1)^ = +1,
isto é, se det(ií(xi, 2:2, A)) > 0 em um candidato (2:1, X2, A), então (xi, X2, A) é
um ponto de máximo local de / em D. Se det(ií(xi, X2, A)) possui 0 mesmo
sinal de (—1)^ = —1, isto é, se det(ií(xi, X2, A)) < 0 em um candidato
(xi, X2, A), então (xi, X2, A) é um ponto de mínimo local de / em D.
No ponto (xi, X2, A) = (0, —\/3, 0) temos

0 0 -2 ^ /3
H { 0 , - V 3 , 0) = 0 - 2 Vã 0
-2 V3 0 0

cujo determinante é +24 V3 > 0, de modo que (0, —V3) é um ponto de


máximo local de / em D.
No ponto (xi,X2, A) = (0 ,+ \/3 ,0) temos

0 0 + 2 V3
H {0,-V3,0) = 0 +2 Vã 0
+2 V3 0 0

cujo determinante é —24\/3 < 0, de modo que (0,+Vã) é um ponto de


mínimo local de / em D.
Estes resultados coincidem com aqueles obtidos no exercício resolvido
(12.2), através da análise geométrica das curvas de nível de f e h. ^

Condições de segunda ordem para otimização com restrições mistas

Sejam / , /ii, . . . , h m , 5i, •••^ 9 k funções de classe definidas em e


* //*
p um ponto para o qual existem números reais AJ, . . . , A‘|m5 H'1j Mit que
satisfazem o sistema
12.8 Condições de segunda ordem* 519

V / (P ) = MÍ
h{p) = Cl,

hm{p) = C77I
= 0,
■ b i( p ) -H

= 0,
' bfc(p) - bk]
MÍ > 0,

Mfc > 0,
5 i(p ) < bi ,

9k{p) < bk-

Defina h(x) = (fii(x),. . . , /im(x)), g(x) = (ffi(x),... , 5í;(x )), o lagrangeano

= /(x ) - Al •[/ii(x) - Cl] - ■[^m(x) C^]


- Ml •[51 (x) - í>i] - - ■[M*:(x ) - bk],

a matriz

X* *1 d'^L
g^2ÍP,^ ,AÍ ) (p> A*, aí*)
dx\dxn
D lL { p ,y ,f x * ) =
d^L d‘^L
(p , a *,m*)
dXndxi d'^Xn

D = {x G M" I /li(x) = Cl, . . . , /lm(x) = Cm, í/i(x) < Òi, . . . , fffc(x) < Òfc} .

Caso alguma restrição em desigualdade esteja ativa em p, vamos renomeá-


las de forma que elas sejam as I primeiras: 51, . . , , gi. Finalmente, defina
g^(x) = Í 9 i { x ) , . . . , gi { x) ) e
520 O tim ização com restrições

Omxm Omx/ Dh(p)

H{p,X,fji) - 0/xm Oíxí D s a Íp )


D h(p)^ DE a Íp V DlL{p,X*,fj,*) ^

Se para todo v 7^ 0 com í?h(p) • v = 0 e Z)g^(p) • v = 0 tem-se

g (v ) = •D l L { ^ , X \ n * ) - v < 0,

então p é um ponto de máximo local de / no conjunto admissível D. A fim


de que isto ocorra, é suficiente que det(fí(p, A*, /x*) tenha o mesmo sinal de
(—1)" e os últimos n — {m + l) menores principais líderes de H { p , X * , f j , * )
alternem de sinal.

12.9 Q uestões de globalidade

As condições de segunda ordem estabelecidas na seção anterior estabele­


cem um critério para decidir se um ponto que satisfaz as condições de pri­
meira ordem é um extremo local. Elas nada afirmam sobre a globalidade do
ponto. A exemplo de problemas de otimização sem restrições (capítulo 11),
é preciso impor propriedades adicionais nas funções envolvidas, afim de se
obter globalidade.
Mais uma vez, a noção de convexidade desempenhará um papel impor­
tante. De fato, vale 0 seguinte teorema de “suficiência”:

T eorem a 12.11 Sejam hm, 91, • • , 9k funções de classe


de n variáveis definidas em um aberto convexo,U de MP e seja p e R"
um ponto no conjunto admissível

D = {x 17ii(x) = Cl, . , hm{x) = Cm, 9i{^) <&!,•••, 5fc(x) < bk},


formado com m restrições em igualdade e k restrições em desigualdade,
onde X 5= (ái, Se
(1) a função / é uma côncava em U,
(2) as funções hi, hm sãf> lineares,
12.10 E xercícios 521

(3) as funções gi, gk são convexas em U e


(4) p satisfaz as condires de primeira ordem,

W(P) ^ Y ^ K - V h i p ) + ^fj^-Vg^ip)^
ÍÍÍIÍÍIÍÍÍÍÍÍÍÍÍÍÍÍÍII|i:|g ^

^w(p) —
f 4 - [ 9 i { p ) ~ h ] = 0,

9 'k - [ 9 k ip ) - h ] = 0,
Ml > 0,

5i{p) < K

para valores adequados dos multiplicadores A| e /i|,

então p é um ponto de mínimo global de f em D

12.10 Exercícios

[01] Na figura (12.13) encontram-se algumas curvas de nível de uma função


escalar / e uma curva de nível D de uma função escalar h, com f e h
de classe C°° definidas em R^. Os vetores indicam a direção e sentido
do vetor gradiente.
(a) O ponto p pode ser extremo local de / no conjunto admissível D l
Em caso afirmativo, o ponto p seria máximo ou mínimo local? E
possível garantir a globalidade?
(b) O ponto q pode ser extremo local de / no conjunto admissível D l
Em caso afirmativo, o ponto q seria máximo ou mínimo local? E
possível garantir a globalidade?
522 Otim ização com restrições

Figura 12.13: Desenho das curvas de nível de / e do conjunto admissível D


(curva com traçado mais forte).

(c) O ponto r pode ser extremo local de f no conjunto admissível D7


Em caso afirmativo, o ponto r seria máximo ou mínimo local? E
possível garantir a globalidade?
(d) O ponto s pode ser extremo local de / no conjunto admissível D7
Em caso afirmativo, o ponto s seria máximo ou mínimo local? E
possível garantir a globalidade?

[02] Use o teorema dos multiplicadores de Lagrange para encontrar os ex­


tremos globais de /(x , y) = x + y no conjunto admissível

D = {(x, y) G \x^ + y^ = 1}.

[03] Sejam f{x, y) = x^ + y e

D = {(x,?/) G I + = 1}.

(a) Use 0 teorema dos multiplicadores de Lagrange para encontrar os


extremos globais de / no conjunto admissível D.
(b) Mostre que o ponto (\/2/2, \/2/2) não é um extremo global de /
em D. Justifique sua resposta cuidadosamente.
12.10 Exercícios 523

(c) Mostre que o ponto (\/2/ 2, V ^/2) não é um extremo local de /


em D. Justifique sua resposta cuidadosamente.
(d) Faça um esboço de algumas curvas de nível de / e do conjunto
admissível D (em um mesmo sistema cartesiano) para estabelecer
uma interpretação geométrica das soluções obtidas no item (a). Use
esta figura para determinar se o ponto (0, 1) é máximo local, mínimo
local ou nenhuma destas coisas para o problema de otimização.

[04] Use o teorema dos multiplicadores de Lagrange para encontrar os ex­


tremos globais de f{x^y) = x + no conjunto admissível

D = { ( x , y ) e R 2 I ( ^ _ 2 ) 2 + y2 = l} .

[05] Considere a função-objetivo f[xi, x^, x^) = X\X2 + X2X2, + x\x^ e o con­
junto admissível

D = {(xi, X2, X3) E 1Xi + X2 + X3 = 3}.

(a) Mostre que (1, 2, 0) não é extremo global de / em D. Justifique sua


reposta cuidadosamente.
(b) Mostre que (1, 2, 0) não é extremo local de / em D. Justifique sua
resposta cuidadosamente.
(c) Mostre que todos os pontos do conjunto admissível satisfazem a
condição de regularidade exigida pelo teorema dos multiplicadores
de Lagrange.
(d) Mostre que (1, 1, 1) é 0 único ponto admissível que satisfaz as condi­
ções de primeira ordem para um valor apropriado do multiplicador
de Lagrange.
(e) Mostre que o conjunto admissível não é compacto. Justifique sua
resposta cuidadosamente.
(f) Mostre que / não possui mínimos globais em D. Justifique sua
resposta cuidadosamente.

Como o conjunto admissível D não é compacto, não sabemos, a priori, se


/ possui máximos globais em D. Se este for 0 caso, pelos itens (c) e (d),
o ponto de máximo global dever ser igual a (1, 1, 1). Para demonstrar
que, de fato, (1, 1, 1) é ponto de máximo global de / em D, considere
524 Otim ização com restrições

g{xi, X2) = f{xi, X2, 3 - xi - X2) = X1X2 + (xi + a;2)(3 - xi - X2)

e os itens a seguir.
(g) Mostre que (x*, com z* = 3 — x* — y*, é ponto de máximo
global de / em D se, e somente se, (x*, y*) é ponto de máximo global
de g em .
(h) Use as técnicas do capítulo 11 para demonstrar que (x*, y*) = (1,1)
é ponto de máximo global de g em R^.
(i) Use os itens (g) e (h) para concluir que (1,1,1) é ponto de máximo
global de / em D.
[06] Encontre a distância máxima e mínima da origem (0, 0) até a elipse
x^ + = 3. Sugestão: use x^ + y^ no lugar de ^/x^ + y^ como
função-objetivo. Veja o exercício [11] da página 361 para saber porque
podemos fazer isto.
[07] Encontre o ponto (x*, y*) da parábola y = x^ que está mais próximo do
ponto (2,1). Você pode assumir que tal ponto existe.
[08] Calcule o posto das matrizes abaixo.

■1 0 1 2■
'2 2 ' '0 1 0'
■1 0 0 ■ 2 15 1
(a) 1 0 , (c) 0 0 1 . (d)
0 1 0 , (b) 0 2 3 0
.01. . 1 0 0_
. 1 0 0 0 .

[09] Considere a matriz

a 0 0
M =
1 h 0

Para que valores de a e 6 a matriz M tem posto 2, posto 1 e posto 0?


[10] Verdadeira ou falsa? Se A é uma matriz m x com m > então o
posto de A é menor do que m. Apresente uma demonstração caso a
sentença seja verdadeira ou um contra-exemplo caso ela seja falsa.
[11] Verdadeira ou falsa? Seja

a b c
A=
d e f 2x3
12,10 Exercícios 525

uma matriz tal que a ^ 0. Se o posto de A é 1, então existe uma


constante k tal que
(á, e , f ) = k- {a, b, c).
Apresente uma demonstração caso a sentença seja verdadeira ou um
contra-exemplo caso ela seja falsa.

[12] Encontre o ponto (x*,y*,z*) mais próximo da origem (0,0,0) que está
simultaneamente nos planos 3x —y + z = 5 e x + y + z = 1. Você pode
assumir que tal ponto existe.

[13] Encontre os extremos de f { x , y , z ) = x + y + z'^ sujeitos às restrições


x"^ + y^ + z“
^ = I e y = 0.

[14] Considere o conjunto restrição D definido por

' xi >0,
< X2 >0,
, X2 - (xi - i f < 0.

Resolva as questões abaixo.

(a) O ponto (0,5) é admissível? E o ponto (1,0)?


(b) Quais são as restrições que estão ativas no ponto (7,7)? E no ponto
(5,16)? E no ponto (7,0)? E no ponto (1,0)?
(c) Verifique que o ponto (1,0) não satisfaz a condição de regularidade
exigida pelo teorema de Karush-Kuhn-Tucker.
(d) Faça um esboço do conjunto admissível D.

[15] Considere o conjunto admissível D definido por

Xi > 0,
X-í < 2,
X2 > 0,
X2 < 2,
I ( X i - l ) 2 + ( y i - l ) 2 > 1.

Resolva as questões abaixo.

(a) O ponto (1,1) é admissível? E o ponto (1,0)? E o ponto (0,0)? E


o ponto (1 - \/2 /2 ,1 - v^/2)?
526 O tim ização com restrições

(b) Quais são as restrições que estão ativas no ponto (2,2)? E no


ponto (1, 2)7 E no ponto (1, 0)7 E no ponto (1/4,1/4)7
(c) O ponto (1, 0) satisfaz a condição de regularidade exigida pelo teo­
rema de Karush-Kuhn-Tucker? E o ponto (2,0)7
(d) As restrições x\ > 0, < 2, X2 > 0, 0:2 < 2 e (xi —l)^+ (x2—1)^ > 1
satisfazem a hipótese do teorema (12.10)7
(e) Faça um esboço do conjunto admissível D. Ele é um conjunto com­
pacto?
[16] Apresente uma prova geométrica para 0 fato de que o gradiente de f e
0 gradiente de g possuem 0 mesmo sentido em um ponto que minimiza
f{x,y) sujeito a g{x,y) > b.
[17] Associe as quatro sentenças a seguir
(a) (x*,y*) é um mínimo de f{x^y) sujeito à restrição h{x^y) < c
que está ativa neste ponto, que satisfaz a condição de regularidade
V % * ,y * )^ (0 ,0 ).
(b) (x*,y*) é um mínimo de f{x,y) sujeito à restrição h[x^y) > c
que está ativa neste ponto, que satisfaz a condição de regularidade
VM x*,2/*)t^(0,0).
(c) (a:*,y*) é um máximo de f{x^y) sujeito à restrição h{x^y) < c
que está ativa neste ponto, que satisfaz a condição de regularidade
v M x * ,y * )/(o ,o ).
(d) (x*,2/*) é um máximo de f{x^y) sujeito à restrição h{x^y) > c
que está ativa neste ponto, que satisfaz a condição de regularidade
V % * ,y * ) /( 0 ,0 ) .
com as outras duas abaixo
(1) Existe A* > 0 tal que V/(x*,y*) = A* • V/i(x*,y*).
(2) Existe A* < 0 tal que Vf{x\y*) = A* • Vh{x*,y*).
Aqui f e h são funções de classe C^. Justifique sua resposta.
[18] Considere o problema de otimização que consiste em

maximizar x + 2y
sujeito a x^ + y^ < 1,
a; > 0,
2/ >0.
12.10 Exercícios 527

(a) Verifique que todos os pontos do conjunto admissível do problema


de otimização satisfazem a condição de regularidade exigida pelo
teorema de Karush-Kuhn-Tucker.
(b) Escreva o lagrangeano e as condições de primeira ordem (sistema
lagrangeano) para o problema de otimização.
(c) Encontre todos os pontos que satisfazem as condições de primeira
ordem do problema de otimização.
(d) O problema de otimização possui solução? Em caso afirmativo,
encontre-a! Justifique cuidadosamente sua resposta.

[19] Considere o problema de otimização que consiste em

maximizar X + y + 50 z
sujeito a z 2_y2^4>0,
z + x'^ + y^ 4 < 0,
X > 0,
2/ >0.

(a) Escreva as condições de primeira ordem (sistema lagrangeano) para


o problema de otimização.
(b) Quais restrições estão ativas no ponto p = (0, 0,4)?
(c) Mostre que p = (0,0,4) não é solução do problema de otimização.
Justifique cuidadosamente sua resposta.

[20] Considere o problema de otimização que consiste em

maximizar x+y+z
sujeito a 2 — + 8 >0,
z + x^ + y^ < 0.

(a) Faça um esboço do conjunto admissível do problema de otimização.


(b) Mostre que todos os pontos do conjunto admissível do problema
de otimização satisfazem a condição de regularidade exigida pelo
teorema de Karush-Kuhn-Tucker.
(c) Escreva o lagrangeano e as condições de primeira ordem para o
problema de otimização.
(d) O problema de otimização possui solução? Em caso afirmativo,
encontre-a! Justifique cuidadosamente sua resposta.
528 Otim ização com restrições

[21] Considere o problema de otimização que consiste em

maximizar x + 2y + Az
sujeito a + 2/^ + < 64,
+ z‘^ > 21,
X > 0,
2/> 0,
0.

(a) Mostre que o problema de otimização não possui soluções no interior


do conjunto admissível. Justifique sua resposta.
(b) Mostre que o problema de otimização não possui soluções onde ape­
nas a restrição x^ + > 21 está ativa.

[22] Considere o problema de otimização que consiste em

maximizar 2 X -j- y -j- 2 2^


sujeito a x + 2y + z = 1,
x^ + y^ < 1.

(a) Escreva o lagrangeano e as condições de primeira ordem para o


problema de otimização.
(b) Encontre todos os pontos que satisfazem as condições de primeira
ordem do problema de otimização.
(c) Mostre que todos os pontos do conjunto admissível do problema
de otimização satisfazem a condição de regularidade exigida pelo
teorema de Karush-Kuhn-Tucker.
(d) O problema de otimização possui solução? Em caso afirmativo,
encontre-a! Justifique cuidadosamente sua resposta.

[23] Considere o problema de otimização que consiste em

maximizar x + 250 y + 200 2;


sujeito a x^ + + 2:^ < 3,
x^ + y^ — < 1,
X > 0,
2/ >0,
^ > 0.
12.10 Exercícios 529

Mostre que p = (0, \/2 ,1) não é um máximo local do problema de


otimização. Justifique cuidadosamente sua resposta.

[24] Considere o problema de otimização que consiste em

maximizar x+y+z
sujeito a + 2/^ + = 3,
X > 0,
y > 0,
z > 0.

(a) Faça um esboço do desenho do conjunto admissível e diga se ele é


compacto ou não.
(b) O problema de otimização admite solução? Justifique sua resposta!
(c) Verifique a condição de regularidade exigida pelo teorema de Ka-
rush-Kuhn-Tucker.
(d) Escreva as condições de primeira ordem deste problema de oti­
mização.
(e) Resolva o sistema obtido a partir das condições de primeira ordem.
Especifique cuidadosamente os seus cálculos!
(f) Verdadeira ou falsa? O ponto (x,2/,z) = (1,1,1) é a solução do
problema de otimização. Justifique cuidadosamente sua resposta!

[25] Verdadeira ou falsa? O ponto (x,j/) = (1,1) não é mínimo global da


função
f{x, y) = x'^ - 2 V s x y - y ^
sujeito à restrição
h{x,y) = x'^ + y^ = 2.
Justifique cuidadosamente sua resposta.

[26] Maximize f{x^y) = x^ + sujeito às restrições 2x + y < 2 , x > 0 e


y>0.
[27] Maximize f{x^y) = 2y^ —x sujeito às restrições x^ + < 1, x > 0 e
y>0.
[28] Maximize 3xy — x^ sujeito às restrições 2x —y = —5, 5x + 2y > 27,
X > 0 e y > 0.
530 O tim ização com restrições

[29] Minimize —2y sujeito às restrições x^ + y ^ < l , x > 0 e y > 0 .


[30] Minimize 2 + 2 —2 xy —9 y sujeito a 4 x + 3 y < 10, y —4 x ^ > —2,
X > 0 e y > 0.
[31] Considere o problema de maximizar /(x , y, z) = xyz + z sujeito ax^ +
y^ + >2^ < 6, x > 0, y > 0 e z > 0.
(a) Escreva as condições de primeira ordem associadas a este problema.
(b) Determine se a restrição x^ + y^ + z < 6 está ativa ou não na solução
(ou soluções) do problema.
(c) Encontre a solução das condições de primeira ordem que inclui o
caso X = 0.
(d) Encontre três equações nas variáveis x, y e z que devem ser satis­
feitas se X / 0 na solução.
(e) Mostre que x = l, y = l e 2: = 4 satisfazem estas equações.
[32] Considere o problema de otimização que consiste em

maximizar x^ + y^ +
sujeito a X > 0,
X < 1,
2/ >0,
2/ < 1-
z > 0,
z< l.

(a) Faça um esboço do desenho do conjunto admissível.


(b) Verifique a condição de regularidade exigida pelo teorema de Ka-
rush-Kuhn-Tucker.
(c) Escreva as condições de primeira ordem deste problema de oti­
mização.
(d) O problema de otimização possui solução? Em caso afirmativo,
encontre-a! Justifique cuidadosamente sua resposta.
[33] Uma caixa de madeira sem tampa deve ser construída de forma a conter
a cm^, onde a é um número positivo dado. Ignorando-se a espessura
da madeira, como a caixa deve ser construída a fim de se utilizar a
menor quantidade de madeira (medida pela soma das áreas dos lados
da caixa)?
12.10 Exercícios 531

[34] Encontre a expressão geral (em termos de todos os parâmetros) do ponto


{xijX 2) que maximiza a Cobb-Douglas U{xi^X2) = kxix\~°^ sujeito a
P1X1+P2X2 = L
[35] Utilize multiplicadores de Lagrange para encontrar o ponto {x*^y*,z*)
do plano ax + by + cz = d mais próximo da origem (0,0,0), com a, 6 e
c constantes não simultaneamente nulas.
[36] Maximize x^^y^^z^ sujeito d. x^^+ y^^ + z"^ = c, onde c é uma constante real
positiva fixa. Qual é 0 valor máximo da função-objetivo no conjunto
determinado pela restrição? Mostre que para todo x, ?/, z G M ocorre

+ 2/^ +
<

Esta desigualdade afirma que a média geométrica de três números po­


sitivos é sempre menor ou igual do que a média aritmética destes três
números. Mais ainda, estas médias são iguais se, e somente se, os três
números (a:^, y^ e são iguais. Naturalmente, a mesma demonstração
funciona para um conjunto de n números positivos:

x\ + xl + + X^
X-\ ' Xn '^n — n
com igualdade se, e somente se, = X2 = • • • =
[37] Determine 0 valor máximo da função

f (^Ij • • • ) ^n) — y j ' ^ 2 ........

no conjunto admissível formado pelos pontos {x\, X2, •. •, Xn) em ! que


satisfazem as restrições

2^1 + 2^2 + + = c,
xi > 0,
X2 > 0,

onde c é uma constante real. Deduza então a desigualdade


X \ -\r X 2 +
Xi Xn ^
n
532 O tim ização com restrições

entre as médias geométrica e aritmética dos números xi, X2, . . . ,


Compare com o exercício anterior.
[38] Verdadeira ou falsa? Sejam f : R ^ —^ R e h i R ^ R funções de
classe C^ . Suponha que o sistema associado às condições de primeira
ordem
í V /( x ) = A -V /i(x ),
[ /i(x) = 0,

possua uma única solução (x*, A*). Então x* é um extremo global de /


no conjunto admissível

D = {x G I /i(x) = 0} .

Apresente uma demonstração caso a sentença seja verdadeira ou um


contra-exemplo caso ela seja falsa.
[39] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma demonstração caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.

(a) Sejam / : I e h: funções de classe Suponha que


o sistema
í , dh, ,
^(x,y) = A .^ íx .s ) ,
d f, . \ dh, ,

h{x,y) = 0,
não possua soluções. Então / não possui extremos globais no con­
junto
C = {{x,y) e I h{x,y) = O} .
(b) Sejam / : R^ — funções de classe C°°. Suponha que
0 sistema

df. X dh
^ { x . y ) = A .^ ( x ,s ) ,

h{x,y) = 0,
12.10 Exercícios 533

não possua soluções e que


Vh{x,y) ^ (0,0) para todo {x,y) G
Então / não possui extremos globais no conjunto
C = {{x,y) e I h{x,y) = O} .
(c) Sejam / : R ^ - 4 - R e / i : K ^ —>-R funções de classe C°°. Suponha que
0 sistema
r a /. , , dh . ,

d f, . X dh , .

h{x,y) = 0,
possua uma única solução (x*, y*, A*) com
Vh{x*,y*)^{0,0).
Então (x*,y*) é um extremo local de / no conjunto
C = {{x,y) € R^ I h{x,y) = O} .

[40] Sejam / :R " ^ R e / i : R " ^ R funções de classe C°°. Suponha que


p = (x*, Aj) e q = (x*, A2) satisfaçam as condições de primeira ordem

íV /(x ) = A-Vh(x),
I h(x) = 0.

Mostre que se x* satisfaz a condição de regularidade exigida pelo teo­


rema dos multiplicadores de Lagrange, então Aj = A2.

Em outras palavras, se x* satisfaz a condição de regularidade, então não


podem existir dois multiplicadores A, e A2 diferentes tais que (x*, Aj) e
(x*, A2) satisfaçam as condições de primeira ordem.
[41] Considere

Maximizar f{ x ,y )
problema de otimização 1:
sujeito a h\{x,y) = 0.

Maximizar f{ x ,y)
problema de otimização 2:
sujeito a h2 {x,y) = 0.
534 O tim ização com restrições

onde /(x , y) = x + y, hi[x, j/) = - 1 e /i2(x, y) = (x^ + r - 1)^

(a) Mostre que todos os pontos do conjunto admissível do problema


de otimização 1 satisfazem a condição de regularidade exigida pelo
teorema dos multiplicadores de Lagrange.
(b) Mostre que todos os pontos do conjunto admissível do problema de
otimização 2 não satisfazem a condição de regularidade exigida pelo
teorema dos multiplicadores de Lagrange.
(c) Verdadeira ou falsa? Um ponto p 6 é solução do problema de
otimização 1 se, e somente se, p G é solução do problema de
otimização 2. Justifique cuidadosamente sua resposta.
(d) Escreva as condições de primeira ordem (sistema lagrangeano) para
o problema de otimização 2 e mostre que o sistema resultante não
possui soluções.
(e) Encontre todos os pontos que resolvem o problema de otimização 2.
Justifique cuidadosamente sua resposta.

[42] Verdadeira ou falsa? Sejam / : e h: funções de


classe Considere o conjunto

D = {(a:,í/) e | h{x,y) = 0}.

Se todo ponto (x,y) G D satisfaz Vh{x,y) = (0,0), isto é, se todo


ponto de D não satisfaz a condição de regularidade, então / não possui
extremos globais em D. Apresente uma justificativa caso a sentença
seja verdadeira ou um contra-exemplo caso ela seja falsa.

[43] Verdadeira ou falsa? Se / : e h: são funções de


classe e o conjunto

c = {(x, 1/) € I h{x, y) = 0}

não é compacto, então / não possui extremos globais em C. Justifique


cuidadosamente sua resposta, apresentando uma demonstração caso a
sentença seja verdadeira ou um contra-exemplo caso ela seja falsa.

[44] Diga se cada uma das sentenças abaixo é verdadeira ou falsa, apresen­
tando uma demonstração caso ela seja verdadeira ou um contra-exemplo
caso ela seja falsa.
12.10 Exercícios 535

(a) Se 0 conjunto de pontos (x, y) que satisfazem a desigualdade


9{x,y) < 1
é um conjunto compacto, então o conjunto de pontos que satisfazem
a desigualdade
-9Íx,y) > -1
não é compacto. Aqui g é uma função de classe C°° definida em .
(b) Sejam / : R ^ —^ R e ^ i R ^ ^ R funções de classe C°°. Suponha que
O sistema

r V /( x ,2/) = A-Vp(x,í/),
I 9{x,y) = 0,
não possua soluções. Então / não possui extremos globais no con-
junto C = {(x,y) € R^ | 9{x,y) = O}.
(c) Sejam / : R ^ - f R e ^ : R ^ —)-R funções de classe C°°. Suponha que
o sistema
r V /(x,j/,z) = X- V g {x ,y, z ),
I 9 {x,y,z) = 0,
possua uma única solução (x, y, z, A) = (a*, 6*, c*, A*) para a qual
V5(a*,6*,c*)7^(0,0,0).
Então (x,y,z) = (a*,b*,c*) é um extremo global de = f{x,y,z)
sujeito à restrição g{x, y, z) = 0.
[45] Resolva o problema de otimização, que consiste em
n
maximizar / ( x i , .., ■) 2/1) • • • ) 2/n ) ~ ^ ' Vi J
2= 1
n
sujeito a • ) ^ n ) 2/1) • • • ) 2/n )
2=1
n
h2{xi,.. • ) ^n) 2/1) • • • ) 2/n ) = =
2=1

A partir das soluções obtidas, deduza a desigualdade de Cauchy-Schwaxz


n

^ ^ 0'i' bi
i=l \ ir ’ \U
536 Otim ização com restrições

escrevendo xi = clí/Y11=i ^ Vi — ^í / Y a =i • Compare com as provas


sugeridas no exercício [46] da página 78 e no exercício [25] da página 158.
[46] Se a, 6 e c são constantes positivas, ache os pontos (x, y, z) do elipsóide

---- h — H---- = 1
a2 ^ Ò2 ^ c2
que estão mais perto da origem 0 = (0,0,0).
[47] (O significado do m ultiplicador de Lagrange) Considere o pro­
blema de otimização que consiste em
Maximizar /(x , y) = x + y
sujeito a /i(x, y) = = a.

(a) Resolva o problema de otimização para o caso a* = 1. Mostre que,


neste caso, o valor máximo de / é z* = \/2 e que o multiplicador
de Lagrange associado ao ponto de máximo é A* = y/2f2.
(b) Resolva o problema de otimização para o caso a > 0.
(c) Note que, para cada a > 0, você encontrará um ponto de máximo
que depende de a e, conseqüentemente, um valor máximo de / no
conjunto admissível que também depende de a. Mostre que
^ Va
é a função que estabelece a dependência do valor máximo de / no
conjunto admissível em função do parâmetro a.
(d) Mostre que

da^ ^ ~ ^ ■
O que os cálculos acima mostram é a evidência de um resultado que
vale em geral.

Teorema X2.12 Sejam / e funções da classe C^ . Para um


dado valor do parâmetro a, seja a solução do pro­
blema dé otimização

Maximizar f {x, y)
sujeito a h{x, y) — u,
12.10 Exercícios 537

e seja A* o multiplicador de Lagrange correspondente. Suponha


ainda que x* = ar*(a), y* = y*(o) e A* = A^(a) sejam funções de
classe tais que {x*{a), y*{a)) satisfaça a condição de regula­
ridade para cada valor de c. Então

Desta maneira, o multiplicador mede a sensitividade do valor ótimo da


função objetivo com relação a variações de um parâmetro que determina
o conjunto admissível. Sendo assim, ele fornece uma medida natural do
valor de recursos escassos em problemas econômicos de maximização.
Evidentemente, o teorema acima pode ser generalizado para o caso de
várias restrições dependendo de várias variáveis. Veja a referência [71].
Economistas chamam A*(a) de preço sombra do parâmetro a.
Apêndice A

Ferramenta computacional: MuPAD

A .l Introdução

O que é M uP A D ?

MuPAD é um ambiente desenvolvido para cálculos matemáticos, sejam


eles simbólicos, numéricos ou gráficos. O programa é desenvolvido por um
grupo de pesquisadores da Universidade de Paderborn, Alemanha. Sua dis­
tribuição é gratuita para professores e alunos. Você pode baixá-lo no en­
dereço h t t p ://www.mupad. de.

P o r que u sar M uPA D e não m inha calculadora?

Bem, você poderia perguntar: o que MuPAD faz que minha calculadora
não pode fazer? A resposta está nos cálculos simbólicos. Por exemplo, se
você faz a divisão 1/3 em sua calculadora, o que você verá não é 1/3 mas
sim uma aproximação de 1/3. Mais ainda, se você deseja somar 1/3 com
1/7 com sua calculadora, o que você estará fazendo é somar aproximações
destes números e o que você obterá é uma aproximação da resposta exata (no
caso, 10/21). MuPAD tem a habilidade de lidar com informações de maneira
simbólica mantendo e manipulando símbolos e expressões. Evidentemente,
MuPAD pode fazer muito mais do que somar frações. Com ele você pode ob­
ter soluções exatas de muitos problemas matemáticos, incluindo fatoração de
números inteiros e polinómios, cálculo com matrizes, sistemas lineares e não-
lineares de equações, números complexos, trigonometria, limites, derivadas,
integrais, equações diferenciais, etc.
540 Ferramenta computacional: M uPA D

A .2 Iniciando o programa

Para entrar no programa, dentro do Microsoft Windows, selecione suces-


sivamente as opções

Iniciar Programas -> MuPAD Light 2.0 — >


MuPAD Light

Se tudo correr bem, você deverá ver uma tela como a indicada na figura (A.l).

Figura A .l: Iniciando MuPAD.

MuPAD é baseado em uma linha de comandos. Isto significa que você


deverá digitar comandos (que em breve aprenderemos) em frente ao prompt
indicado pelo símbolo •. Por exemplo, se você quer somar 2 com 2, basta
emitir o comando (veja a figura (A.2))

2 + 2;
A .2 Iniciando o programa 541

para obter a resposta 4 (você deve pressionar a tecla ENTER a fim de que
MuPAD execute o comando).

Figura A.2: MuPAD sabe que 2 + 2 = 4.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Todo e qualquer comando em MuPAD deve terminar com um ponto e


vírgula (;). Este é um dos erros mais freqüentes para quem começa a
aprender MuPAD. Se você digitou um comando e esqueceu de colocar
o ponto e vírgula no final então você terá que digitar todo o comando
novamente (não esquecendo de colocar o ponto e vírgula desta vez).
Em MuPAD não é possível editar um comando digitado anterior mente.
Porém, para poupar esforço de digitação, você pode usar o sistema co-
piar/colar dentro do Microsoft Windows.
542 Ferramenta computacional; M uPAD

A .3 Operações aritm éticas

O comando a seguir reinicia o sistema. Sempre antes de uma nova “bateria”


de cálculos é importante reinicializar o sistema.

• reset 0 ;

O comando a seguir calcula 1 + 5/2.

• 1+5/2;

7/2

Como você pode ver, MuPAD pode realizar cálculos com números inteiros e
racionais de maneira exata.

• (1 + (5/2 * 3)) / (1/7 + 7/9)'-2;

67473/6728

O sistema pode realizar eíicientemente cálculos com números muito grandes.


O tamanho do número é limitado apenas pela memória disponível em seu
computador.

• 1234"123;

17051580621272704287505972762062628265430231311\
10682904705296193221839138348680074713663067170\
60598572641592314554345900570589670671499709086\
10253990484651479313561730556366999395010462203\
56820273557577550700832384441477783960263870670\
42685700404003287042480639680696865587865016699\
38388338883198045915994284537241460180942971772\
61076285952434068010144185297662798380672035627\
99104

O comando isprim e(n) verifica se n é um número primo.


A .4 Variáveis, atribuições e funções 543

• isprime(2398232343243249984321312321);

FALSE

O comando Factor(n) escreve a decomposição de n em fatores primos.

• Factor(2398232343243249984321312321);

3 733 15117701 72140687161773179

Na tabela a seguir temos os símbolos em MuPAD para operações aritméticas.

O p e ra ç ã o S ím b o lo E x e m p lo
adição + 2 + 2
subtração - 10 - X
multiplicação * 3*y*z
divisão / x /y
quociente da divisão inteira iquo( . . . ) iq u o (17, 3)
resto da divisão inteira irem(. . . ) irem (1 0 , 7)
exponenciação x''2
valor absoluto abs ( . . . ) a b s (-4 )
fatorial ! 10!
máximo max( . . . ) mcLx(-l, 5, 7)
mínimo mi n(. . . ) m in ( - l, 5, 7)
máximo divisor comum g c d ( . . .) g cd (1 4 , 21, 28)
mínimo m últiplo comum l cm( . . . ) lcm (14, 21, 28)

Tabela A .l: Operações aritm éticas em MuPAD.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Um outro erro freqüente é o de se utilizar 2 x, x2 ou x 2 para indicar


a multiplicação entre 2 e x. Espaços entre símbolos são opcionais mas
MuPAD requer um * explicito para multiplicações: 2*x ou x*2.

A .4 Variáveis, atribuições e funções

Uma outra maneira de se poupar tempo de digitação (além da técnica


de copiar/colar do Microsoft Windows) é utilizar variáveis para representar
544 Ferramenta com putacional: M uPA D

expressões. Por exemplo, se você vai usar muito a expressão

f{ x ,y ) = 9 - x ^ -y'^,

é conveniente criar uma variável que represente esta expressão. Isto é feito
com 0 operador de atribuição (: =):

f := 9 - x'‘2 - y‘ 2;

Após digitar este comando, onde o símbolo f aparecer, ele será substituído
pela expressão 9 — x^ — y"^. Vamos acompanhar um exemplo.

Reinicie o sistema.

• resetO;

Vamos fazer com que a variável f represente um sinônimo para a expressão


9 - x'‘2 - y~2.

• f := 9 - x’'2 - y''2;

2 2
9 - X- y

Vamos calcular {9 — x^ — —(9 — —y^). Para isto, ao invés de digitar


toda a expressão, basta digitar f ~2 - f no lugar.

• f'-2 - f ;

2 2 2 2 2
X + y + ( 9 - x - y) -9

Você pode simplificar a expressão obtida usando o comando sim p lif y ( . . . ) .


O símbolo"/, representa o resultado do último comando executado (uma outra
maneira de se poupar digitação).

• sim p lify (% );

4 2 2 4 2 2
X -17x -17y +y +2x y +72
A .4 Variáveis, atribuições e funções 545

Você pode calcular o valor de9 —x^ —y‘^ em um ponto {x^ y) com o comando
s ubs ( . . . ) . Para calcular o valor da expressão no ponto (x, y) = (1,2), por
exemplo, basta digitar o comando

• s u b s ( f , X = 1, y = 2);

Para limpar o conteúdo da variável f basta usar o comando u n a ssig n (f).


Ao fazê-lo, como resposta, MuPAD mostrará o que a variável estava arma­
zenando.

u n a s s ig n (f);

2 2
X- y

C U ID A D O ! C U ID A D O ! C U ID A D O !

1. Um outro erro muito freqüente é o de se utilizar = no lugar de : =


para indicar atribuições. Como veremos, o símbolo = possui outro
propósito em MuPAD.
2. Uma vez que você atribuiu um determinado valor a uma variável (por
exemplo, com o comando f := 9 - x"2 - y"2), em todo e qualquer
lugar que f aparecer, a partir deste ponto, ele será substituído por
9 - x"2 - y"2. Se você quiser ‘dimpar” o conteúdo de f , emita o
comando u n a ssig n (f). Use o comando r e s e tO para “limpar” o
conteúdo de todas as variáveis simultaneamente.
3. O nome de uma variável pode ter mais de uma letra. Você pode usar
números mas nunca no começo do nome. Espaços em branco e letras
acentuadas não são permitidas,
4. MuPAD faz distinção entre letras maiúsculas e minúsculas. As­
sim, a variável f é diferente da variável F. A mesma obser­
vação vale para funções predefinidas: F actor(x"2 - 2*x + 1) e
fa c to r(x "{ 2 } - 2*x + 1) são dois comandos diferentes.
546 Ferramenta computacional: MuPAD

O comando f := 9 - x"2 - y"2 não define uma função /(x , y) = 9 — —


Com este comando estamos apenas dizendo que f é um ‘^sinônimo” para
9 - x"2 - y"2. O exemplo a seguir mostra como podemos definir funções
em MuPAD e usar a notação funcional a que estamos acostumados.

Vamos definir a função /(x , y) = 9 —x^— que depende de duas variáveis.

• f := func(9 - x"2 - y"2, x, y ) ;

func((9 - x"2) - y"2, x, y)

Vamos calcular o valor de / no ponto (1,2), isto é, vamos calcular /(1 ,2 ).


Uma das vantangens em se definir funções com o comando f u n c (. . .) é que
podemos usar a mesma notação que usamos quando escrevemos textos em
matemática.

• f(l, 2);

Uma vez que f é uma função, podemos facilmente efetuar composições. Por
exemplo, vamos calcular /( a + ò, a —6).

• f (a + b, a “ b ) ;

2 2
9 - (a + b) - (a - b)

Você pode simplificar este resultado com o comando simplify (,

• simplify(yo);

2 2
9 - 2 a -2 b

A .5 Sím bolos e funções m atem áticas predefinidas

MuPAD possui várias funções e constantes matemáticas já definidas. Na


tabela (A.2) temos uma lista de símbolos mais usados com as respectivas
A.6 Manipulando expressões algébricas 547

representações e, na tabela (A.3), uma lista com as funções matemáticas


mais conhecidas.

S ím b o lo R e p re s e n ta ç ã o e m M u P A D
números inteiros -47, 1, 2
números racionais 3 /5 , - 1 /3
representações decimais 1.0, 0.002, .35*10*(-45)
verdadeiro, falso TRUE, FALSE
7T PI
e (base logarítmica natural) e x p ( l) , E
I, ( - l ) - ( l / 2 )
oo in fin ity

Tabela A.2: Símbolos m atem áticos em MuPAD.

Função R e p re s e n ta ç ã o e m M u P A D
y/x (raiz quadrada de x ) s q r t( x )
(exponencial) exp(x)
In X (logaritmo natural) ln ( x )
|o:| (módulo de x ) ab s(x )
mínimo, máximo min, max
seno, cosseno, tangente s in ( x ) , c o s (x ), ta n (x )
secante, cossecante, cotangente s e c (x ), c s c (x ), c o t(x )
funções trigonom étricas inversas a s in ( x ) , a c o s(x ), a ta n (x )
a s e c (x ), a c s c (x ), a c o t(x )
funções hiperbólicas s in h ( x ) , co sh (x ), ta n h (x )
se c h (x ), c s c h (x ), c o th (x )
funções hiperbólicas inversas a s in h (x ) , ac o sh (x ), a ta n h (x )
a s e c h (x ), a c sc h (x ), a c o th (x )
( ^ ) coeficiente binomial b in o m ial (n , m)
\ m )

Tabela A.3: Funções m atem áticas em MuPAD.

A.6 M anipulando expressões algébricas

Além do comando sim plifyC . . .) (utilizado para se fazer simplicações


de expressões), existem dois outros comandos muito úteis para se manipular
expressões algébricas: expandC. . .) e FactorC . . .). O uso mais importante
de expandC. . .) é a multiplicação de produtos em somas. Produtos no
548 Ferramenta computacional: MuPAD

denominador de uma fração não são multiplicados. Assim, por exemplo, o


comando

expand((x + l)* (y + z ) ) ;

devolverá a expressão algébrica

y + z + x*y + x*z.

O comando F actor (. . .) é utilizado para fatorar polinómios. Quando apli­


cado a funções racionais, ele fatora o numerador e o denominador. Por
exemplo, o comando

Factor(3*x"4 + 5*x"3 - 3*x - 1);

devolverá a expressão algébrica


2 2
(x + 1) (3 x - X - 1) .

A .7 Visualizando gráficos e curvas de nível

O comando p lo tfu n c3 d (. . .) permite visualizar gráficos de funções de


duas variáveis definidas em um retângulo. Por exemplo, o comando

p lotfunc3d(x''2 - y"2, x = - 5 ..5 , y = - 5 ..5 ) ;

irá criar uma nova janela (veja a figura (A.3)) com o gráfico da função
z = /(x , y) = —2/^ definida no retângulo [—5,5] x [—5,5]. Você pode usar
os botões

para fazer uma rotação do gráfico. Existem parâmetros adicionais que você
pode usar com o comando p lo tfu n c 3 d (. . . ) . Para maiores detalhes, acesse
a tela de ajuda deste comando:

?plotfunc3d
A.7 Visualizando gráficos e curvas de nível 549

c^lBlaí ^|€il4>|rjH0l(^|y|l^l

Figura A.3: Gráfico da função 2; = f { x , y ) — definida no retângu­


lo [—5, 5] X [—5, 5] gerado por MuPAD.

Para desenhar algumas curvas de nível de uma função de duas variáveis,


você deve usar o comando p l o t : :c o n to u r(. . .). Por exemplo, o comando

plot (plot::contourC [x, y, x"2 - y'^2 ], x = -5..5, y = -5..5,


Contours = [-10, -5, 0, 5, 10],
Grid = [40, 40]));

irá desenhar as curvas de nível áe z = f{x ,y) = — 'ip' associadas aos


níveis 2: = —10, z = —5, 2; = 0, z = 5 e 2: = 10 no retângulo [—5, 5] x [—5,5]
(veja a figura (A.4)). O parâmetro Grid = [40, 40] está relacionado com a
precisão do método numérico que MuPAD usa para desenhar curvas de nível.
Você pode especificar outros números naturais. Quanto maior 0 número,
melhor a precisão e também mais tempo será necessário para o cálculo das
curvas de nível. O parâmetro Contours = [-10, -5 , 0, 5, 10], como
você deve imaginar, especifica quais os níveis que devem ser desenhados (no
550 Ferramenta computacional: MuPAD

caso, os níveis escolhidos são 2; = —10, 2: = —5, z = 0, z = 5 e z = 10).


Maiores detalhes: ? p lo t: icontour.

Figura A.4: Curvas de nível da função 2: = /(a:,y ) = — y'^ associadas aos


níveis z = z = —5, 2: = 0, 2: = 5 e 2: = 10 no retângulo
[—5,5] X [—5,5].

C U ID A D O ! C U ID A D O ! C U ID A D O !

Para executar 0 comando


p l o t ( p l o t : : contourC [x, y, x"2 - y"2 ] , x = - 5 ..5 , y = - 5 ..5 ,
C ontours=[-10, -5 , 0, 5, 10],
G rid= [40,40]));
você precisará digitar em mais do que de uma linha! Para isto, digite
p lo t ( p l o t :: contourC [x, y, x"2 - y"2 ] , x = - 5 ..5 , y = - 5 ..5 ,
A .8 Calculando derivadas parciais 551

e, no final, pressione a tecla SHIFT e, sem largá-la, pressione a tecla


ENTER, o que levará o cursor ao início da próxima linha (se você apenas
pressionar a tecla ENTER, MuPAD tentará executar o seu comando que,
por estar incompleto, gerará uma mensagem de erro). A seguir, digite
Contours = [-10, -5 , 0, 5, 10],
não esquecendo de usar a combinação SHIFT+ENTER no final da linha.
Por último, digite
Grid = [4 0 ,4 0 ]));
e pressione a tecla ENTER para executar todo o comando.

A .8 Calculando derivadas parciais

MuPAD pode calcular derivadas parciais muito facilmente: basta usar o


comando d if f ( . . . ) . Por exemplo,

d iff(c o s(x " 2 - y " 2 ), x ) ;

calcula a derivada parcial de cos(a:^ —y^) com relação à variável x\

2 2
- 2 X sin (x - y ) .

Você pode combinar o comando d if f (. . .) com os comandos de atribuição


e simplificação para fazer cálculos de derivadas parciais muito rapidamente
e com pouco trabalho de digitação. Derivadas parciais de ordem superior
também podem ser calculadas. Reinicie o sistema com o comando re s e tO
e acompanhe a seqüência de comandos a seguir.

Para começar, vamos atribuir à variável f a expressão cos(x''2 - y'^2).

• f := cos(x''2 - y"2) ;

2 2
cos(x - y)
552 Ferramenta computacional: MuPAD

Agora vamos calcular a derivada parcial de f com relação a x e atribuir o


resultado à variável df x e calcular a derivada de f com relação a y e atribuir
0 resultado à variável df y.

• dfx := diff(f, x ) ;

2 2
- 2 X sin(x - y)

dfy := diff(f, y ) ;

2 2
2 y sin(x - y)

Vamos agora verificar o teorema de Young para a função de duas variáveis


f{x,y) = cos(x^ - isto é, vamos verificar que fxy[x,y) = fyx{x,y) ou,
equivalentemente, que fxy(x, y) — fyx{x, y).

• diff(dfx, y) - diff(dfy, x);

O cálculo acima pode ser feito diretamente com o uso da variável f , uma
vez que é possível calcular derivadas parciais de ordem superior diretamente
a partir da função original, sem a necessidade de variáveis auxiliares para
armazenar as derivadas de ordem mais baixa.

• diff(f, X, y) - diff(f, y, x) ;

Para terminar, considere a função g{x, y) = [x + y)/{x^ + y^). Vamos usar a


variável g para armazená-la.•

• g := (x + y)/(x"2 + y'^3) ;

X + 1

2 3
X + y
A.9 Visualizando curvas e superfícies parametrizadas 553

Vamos agora derivar g com relação a x usando o comando d if f ( . . . ) .

• diffCg, x);

1 2 X (x + y)

2 3 2 3 2
X + y (x + y )

Observe que a resposta não está na forma de uma fração, isto é, a resposta
não está em sua forma mais simplificada. Você pode ainda combinar os
comandos normal (. . .) e d i f f ( . . . ) para obter uma resposta simplificada
diretamente.

normal(diff(g, x));

3 2
y - 2 X y - X

4 6 2 3
X + y + 2 X y

A .9 Visualizando curvas e superfícies param etrizadas

Para desenhar o traço de uma curva parametrizada plana, você deve usar
o comando p lo t2 d ( . . .). Por exemplo, o comando
plot2d(Scaling = Constrained,
[Mode = Curve, [t*cos(t), t*sin(t)], t = [0, 3*PI],
Grid = [100]]) ;

irá desenhar o traço da espiral


oc{t) = [t cos(í),í sen(t)),
para í G [0,3 tt] (veja a figura (A.5)). O parâmetro

Scaling = Constrained]

especifica que uma mesma escala deve ser usada para os eixos x e y.
554 Ferramenta computacional: MuPAD

Graphics - VCam Light


ii9 M -

•5.25

X ■5 \

•3.75 \
/
1
•8.75 -7.5 -6.25 -5 -sjõ -2.5 -1.25 O 1.25 2.5 3.75 5 yt.25

I I
-1.25 /

V i
-2.6 /

-3.75

Figura A.5: Traço da curva parametrizada a { t ) = (cos(í), sen(í)) para t no


intervalo [0,37t].

Para desenhar o traço de uma curva parametrizada no espaço, você deve


usar 0 comando p lo t2 d ( . . .). Por exemplo, o comando

p lo t3 d (S c a lin g = C onstrained,
[Mode = Curve, [ c o s ( t) , s i n ( t ) , t ] , t = [0, 3 * P I],
Grid = [1 0 0 ]]);

irá desenhar o traço da hélice a (t) = (cos(í),sen(í), t), para t no intervalo


[0, 3 7t] (veja a figura (A.6)).
O mesmo comando p lo t3 d ( . . .) pode ser usado para desenhar a imagem
de uma superfície parametrizada. Por exemplo, o comando

phi := [(5 + 2*cos(v))*cos(u), (5 + 2 * co s(v ))* sin (u ), 2 * s in ( v ) ] :


p lo t3 d (S c alin g = C onstrained,
[Mode = S urface, p h i, u = [0, 2 * P I], v = [0, 2 * P I],
Grid = [20, 20], Smoothness = [2, 0 ] ] ) ;
A. 10 Calculando gradientes, jacobianas e hessianas 555

Figura A.6: Traço da curva param etrizada a{t) = (cos(t), sen(í), í) p ara t no
intervalo [0, S tt].

irá desenhar a imagem da superfície parametrizada

v) = ((5 + 2 cos(v)) cos(u)j (5 + 2 cos(v)) s e n ( t i ) , 2 s e n ( 'u ) )

para (n,'y) G [0, 2 7t] x [0, 2 7t]) (um toro, veja a figura (A.7)). O parâmetro

Smoothness = [2, 0]

está relacionado com a precisão do método numérico que MuPAD usa para
desenhar a imagem da superfície parametrizada em combinação com o pa­
râmetro Gr i d = [20, 20]. Maiores detalhes: ?plot3d.

A. 10 Calculándo gradientes, jacobianas e hessianeis

Os comandos que calculam o gradiente, a jacobiana e a hessiana de uma


função fazem parte da biblioteca lin a lg de Álgebra Linear. Antes de poder
556 Ferramenta computacional: MuPAD

í Giãphics - VCam Lighl mmmi

r ........................... ................. ......

Figura A.7: O toro.

usá-los, você precisa carregar esta biblioteca. O comando que faz isto é:

e x p o r t( lin a lg ) :

Entre outros comandos, a biblioteca lin a lg disponibilizará os procedimentos


g ra d (. . .), jacobianC . . .) e h e s s ia n ( . . .) que calculam, respectivamente,
o gradiente, a jacobiana e a hessiana de uma função. Lembre-se que só faz
sentido calcular o gradiente e a hessiana de funções escalares, isto é, funções
cujo contradomínio é R. Vamos ver como usar estes comandos com três
exemplos a seguir.

E xem plo A .l Para calcular o vetor gradiente da função escalar de três


variáveis definida por

w = f{x, y, z) = \/x2 + J/2 + ^2,

basta usar o comando


A. 10 Calculando gradientes, jacobianas e hessianas 557

gradCsqrt (x''2 + y"2 + z"2) , [x, y, z] ) ;

Neste caso, MuPAD irá devolver como resultado:


+- -+
X

2 2 21/2
(x + y + z )

2 2 21/2
(x + y + z )

2 2 21/2
(x + y + z )
+-

Observe que, ao contrário da notação usada no texto, MuPAD representa o


vetor gradiente como uma matriz coluna ao invés de uma matriz linha.
Exem plo A .2 Para calcular a matriz jacobiana da função vetorial

(r, s, í) = í{x, y) = [xe^ + cos(y), x, x + e^),

definida de para , basta usar o comando

jacobianC[x*exp(y) + cos(y), x, x + exp(y)], [x, y]);

Neste caso, MuPAD irá devolver como resultado a matriz 3 x 2 :

+- -+
exp(y), - sin(y) + x exp(y)

1,

1, exp(y)
+- -+
558 Ferramenta computacional: M uPAD

Exem plo A .3 Para calcular a matriz hessiana da função escalar de três


variáveis definida por

w - f{ x , y , z ) - x^y^z\

basta usar o comando

hessian(x"2*y"2*z''2, [x, y, z] ) ;

Neste caso, MuPAD irá devolver como resultado a matriz 3 x 3:


+- -+
2 2 2 2
2y z , 4 x y z , 4 x y z

2 2 2 2
4 x y z , 2x z , 4 x yz

2 2 2 2
4xy z, 4 x yz, 2x y
+- “+

Como era de se esperar pelo teorema de Young, esta matriz é simétrica, uma
vez que / é uma função de classe
A p ên d ice B

Ferram enta com putacional: M aple V

B .l Introdução

O q u e é M a p le V ?

Maple V é um ambiente desenvolvido para cálculos matemáticos, sejam


eles simbólicos, numéricos ou gráficos. 0 programa é desenvolvido por um
grupo de pesquisadores da Universidade de Waterloo, Canadá. Apesar de sua
distribuição não ser gratuita, Maple V é um dos programas mais conhecidos
de computação simbólica.

P o r que usar M a p le V e não m in h a calcu lad ora?

Bem, você poderia perguntar: o que Maple V faz que minha calculadora
não pode fazer? A resposta está nos cálculos simbólicos. Por exemplo, se
você faz a divisão 1/3 em sua calculadora, o que você verá não é 1/3 mas
sim uma aproximação de 1/3. Mais ainda, se você deseja somar 1/3 com 1/7
com sua calculadora, o que você estará fazendo é somar aproximações destes
números e o que você obterá é uma aproximação da resposta exata (no caso,
10/21). Maple V tem a habilidade de lidar com informações de maneira
simbólica mantendo e manipulando símbolos e expressões. Evidentemente,
Maple V pode fazer muito mais do que somar frações. Com ele você pode
obter soluções exatas de muitos problemas matemáticos, incluindo fator ação
de números inteiros e polinómios, cálculo com matrizes, sistemas lineares e
não-lineares de equações, números complexos, trigonometria, limites, deri­
vadas, integrais, equações diferenciais, etc.
560 Ferramenta computacional: Maple V

B.2 Iniciando o programa

Para entrar no programa, dentro do Microsoft Windows, selecione suces­


sivamente as opções

Iniciar Programas Maple V Release 5 - Server ->


Maple V Release 5

Se tudo correr bem, você deverá ver uma tela como a indicada na figura (B.l).

fbf Maple V Release 5 - [cdívv.mws]


Iqsáí foiniar ^

[>

Figura B .l: Iniciando Maple V.

Maple V é baseado em uma linha de comandos. Isto significa que você


deverá digitar comandos (que em breve aprenderemos) em frente ao prompt
indicado pelo símbolo >. Por exemplo, se você quer somar 2 com 2, basta
emitir o comando (veja a figura (B.2))

2 + 2;
B.2 Iniciando o programa 561

para obter a resposta 4 (você deve pressionar a tecla ENTER a fim de que
Maple V execute o comando).

3 |áa g<SL Jfww inçaa '. í . - ^ w id D w


iDnürôi íit r ô H p r g w illB ] m nn

^\Tb«0; ÜM. rÇyteí; aílís

Figura B.2: Maple V sabe que 2 + 2 = 4.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Todo e qualquer comando em Maple V deve terminar com um ponto e


vírgula (;). Este é um dos erros mais freqüentes para quem começa a
aprender Maple V. Se você digitou um comando e esqueceu de colocar
o ponto e vírgula, basta você posicionar o cursor no final da linha de
comando (com o mouse ou as setas) e digitar o ponto e vírgula que
estava faltando.
562 Ferramenta computacional: M aple V

B.3 Operações aritm éticas

O comando a seguir reinicia o sistema. Sempre antes de uma nova “bateria”


de cálculos é importante reinicializar o sistema.

> re s ta rt;

O comando a seguir calcula 1 + 5/2.

> 1+5/2;
7
2
Como você pode ver, Maple V pode realizar cálculos com números inteiros
e racionais de maneira exata.

> (1 + (5/2 + 3)) / (1/7 + 7/9)'-2;


67473
6728
O sistema pode realizar eficientemente cálculos com números muito grandes.
O tamanho do número é limitado apenas pela memória disponível em seu
computador.

> 1234~123;
17051580621272704287505972762062628265430231311\
10682904705296193221839138348680074713663067170\
60598572641592314554345900570589670671499709086\
10253990484651479313561730556366999395010462203\
56820273557577550700832384441477783960263870670\
42685700404003287042480639680696865587865016699\
38388338883198045915994284537241460180942971772\
61076285952434068010144185297662798380672035627\
99104

O comando isprim e(n) verifica se n é um número primo.

> isprime(2398232343243249984321312321);
B.4 Variáveis, atribuições e funções 563

false
O comando if a c to r ( n ) escreve a decomposição de n em fatores primos.

> ifactor(2398232343243249984321312321);

(3) (733) (72140687161773179) (15117701)

Na tabela a seguir temos os símbolos em Maple V para operações aritméticas.

Operação Símbolo Exemplo


adição + 2 + 2
subtração - 10 - X
multiplicação * 3*y*z
divisão / x /y
quociente da divisão inteira iq u o (...) iq u o (1 7 , 3)
resto da divisão inteira ir e m ( . . . ) ire m d O , 7)
exponenciação x''2
valor, absoluto ab s( .. .) a b s (-4 )
fatorial ! 10!
máximo max( . . . ) m a x (-l, 5, 7)
mínimo m in (. . . ) m in ( - l, 5, 7)
máximo divisor comum g c d ( ...) g cd (1 4 , 21, 28)
mínimo m últiplo comum lc m (. . . ) lcm (14, 21, 28)

Tabela B .l: Operações aritm éticas em Maple V.

C U ID A D O ! C U ID A D O ! C U ID A D O !

Um outro erro freqüente é o de se utilizar 2 x, x2 ou x 2 para indicar


a multiplicação entre 2 e x. Espaços entre símbolos são opcionais mas
Maple V requer um * explícito para multiplicações: 2*x ou x*2.

B .4 Variáveis, atribuições e funções

Uma outra maneira de se poupar tempo de digitação (além da técnica


de copiar/colar do Microsoft Windows) é utilizar variáveis para representcir
expressões. Por exemplo, se você vai usar muito a expressão
564 Ferramenta computacional; Maple V

é conveniente criar uma variável que represente esta expressão. Isto é feito
com o operador de atribuição (:=):

f := 9 - x'^2 - y^2;

Após digitar este comando, onde o símbolo f aparecer, ele será substituído
pela expressão 9 — —y^. Vamos acompanhar um exemplo.

Reinicie o sistema.

> restart;

Vamos fazer com que a variável f represente um sinônimo para a expressão


9 - x"2 - y"2.

> f := 9 - x'^2 - y'^2;

/ := 9 -

Vamos calcular (9 — —(9 —x^ —y^). Para isto, ao invés de digitar


toda a expressão, basta digitar f "'2 - f no lugar.

> f '2 - f ;

(9 - x^ - - 9 + x^ +1/^

Você pode simplificar a expressão obtida usando o comando sim p lify ( . . .).
O símbolo %representa o resultado do último comando executado (uma outra
maneira de se poupar digitação).

> simplifyCX);

72 —17 x^ —17 + x‘*+ 2 + y'*

Você pode calcular o valor de 9 —x^ —y^ em um ponto (x, y) com o comando
subs ( . . . ) . Para calcular o valor da expressão no ponto (x, y) = (1,2), por
exemplo, basta digitar o comando

> subs(x = 1, y = 2, f ) ;
B.4 Variáveis, atribuições e funções 565

Para limpar o conteúdo da variável f basta usar o comando unassignC ' f O .


O nome da variável deve estar entre apóstrofos (^).

> unassignCO;

CUIDADO! CUIDADO! CUIDADO!

1. Um outro erro muito freqüente é o de se utilizar = no lugar de : =


para indicar atribuições. Como veremos, o símbolo = possui outro
propósito em Maple V.
2. Uma vez que você atribuiu um determinado valor a uma variável (por
exemplo, com o comando f := 9 - x"2 - y "2), em todo e qualquer
lugar que f aparecer, a partir deste ponto, ele será substituído por
9 - x"2 - y"2. Se você quiser “limpaP’ o conteúdo de f , emita o
comando u n a s s ig n ('f O. Use o comando r e s t a r t para “limpar” o
conteúdo de todas as variáveis simultaneamente.
3. O nome de uma variável pode ter mais de uma letra. Você pode usar
números mas nunca no começo do nome. Espaços em branco e letras
acentuadas não são permitidas.
4. Maple V faz distinção entre letras maiúsculas e minúsculas. As­
sim, a variável f é diferente da variável F. A mesma obser­
vação vale para funções predefinidas: F actor(x"2 - 2*x + 1) e
fa c to r(x "{ 2 } - 2*x + 1) são dois comandos diferentes.

O comando f : = 9 - x"2 - y"2 não define uma função /(x , j/) = 9 — —


Com este comando estamos apenas dizendo que f é um “sinônimo” para
9 - x"2 - y"2. O exemplo a seguir mostra como podemos definir funções
em Maple V e usar a notação funcional a que estamos acostumados.

Vamos definir a função /(x , y) = 9 — — que depende de duas variáveis


com o comando unapply (. . .).

> f := unapply(9 - x"2 - y''2, x, y) ;


566 Ferramenta computacional: M aple V

/ := [x, y) 9- - y'^

Vamos calcular o valor de f no ponto (1,2), isto é, vamos calcular /(1,2).


Uma das vantagens em se definir funções com o comando f u n c ( . . .) é que
podemos usar a mesma notação que usamos quando escrevemos textos em
matemática.

> f ( l , 2);

> f ( a , 0);
9—
Uma vez que f é uma função, podemos facilmente efetuar composições. Por
exemplo, vamos calcular /( a + 6, a —6).

> f ( a + b, a - b ) ;
9 - { a + bf - { a - bf
Você pode simplificar este resultado com o comando sim p lify (. . .).

> simplify(7o) ;
9-2a^-2b^

B.5 Sím bolos e funções m atem áticas predefinidas

Maple V possui várias funções e constantes matemáticas já definidas. Na


tabela (B.2) temos uma lista de símbolos mais usados com as respectivas
representações e, na tabela (B.3), uma lista com as funções matemáticas
mais conhecidas.

B.6 M anipulando expressões algébricas

Além do comando sim plifyC . . .) (utilizado para se fazer simplicações


de expressões), existem dois outros comandos muito úteis para se manipular
expressões algébricas: expandí.. .) e f a c t o r C. . .).
B.6 Manipulando expressões algébricas 567

S ím b o lo R e p re s e n ta ç ã o e m M a p le V
números inteiros -47, 1, 2
números racionais 3 /5 , - 1 /3
representações decimais 1.0, 0.002, .35*10‘ (-4 5 )
verdadeiro, falso tr u e , f a l s e
7T Pi
e (base logarítm ica natural) e x p (l)
I, ( - l ) '- ( l / 2 )
00 in fin ity

Tabela B.2: Símbolos m atem áticos em Maple V.

F unção R e p re s e n ta ç ã o e m M a p le V
y/x (raiz quadrada de x) s q r t( x )
(exponencial) exp(x)
In X (logaritmo natural) ln ( x )
\x\ (módulo de x) ab s(x )
mínimo, máximo min, max
seno, cosseno, tangente s in ( x ) , c o s (x ), ta n (x )
secante, cossecante, cotangente s e c (x ), c s c (x ), c o t(x )
funções trigonom étricas inversas a r c s in ( x ) , a r c c o s ( x ), a r c ta n ( x )
a r c s e c (x ) , a r c c s c (x ) , a r c c o t( x )
funções hiperbólicas s in h ( x ) , c o sh (x ), ta n h (x )
se c h (x ), c s c h (x ), c o th (x )
funções hiperbólicas inversas a r c s in h ( x ), a rc c o s h (x ), a rc ta n h (x )
a rc s e c h (x ), a rc c s c h (x ), a rc c o th (x )

( ^ ) coeficiente binomial b in o m ial (n , m)


\m )

Tabela B.3: Funções m atem áticas em Maple V.

O uso mais importante de expand(. . .) é a multiplicação de produtos


em somas. Produtos no denominador de uma fração não são multiplicados.
Assim, por exemplo, o comando

expand((x + l ) *( y + z ) ) ;

devolverá a expressão algébrica

y + z + xy + xz.

O comando f a c to r (. . .) é utilizado para fatorar polinómios. Quando apli­


cado a funções racionais, ele fator a o numerador e o denominador. Por
568 Ferramenta computacional: Maple V

exemplo, o comando facto r(3 * x "4 + 5*x"3 - 3*x - 1); devolverá a ex­
pressão algébrica (3 —x —l) (a; + 1)^.

B .7 Visualizando gráficos, curvas e superfícies de nível

O comando p lo t3 d (. . .) permite visualizar gráficos de funções de duas


variáveis definidas em um retângulo. Por exemplo, o comando

plot3d(x"2 - y"2, x = -5..5, y = -5..5, axes = boxed);

irá criar uma nova janela (veja a figura (B.3)) com o gráfico da função z =
/(x ,j/) = definida no retângulo [—5,5] x [—5,5]. Para fazer uma
rotação, posicione o apontador sobre o gráfico, pressione o botão esquerdo
do mouse e o arraste. Você pode ainda usar os botões

# m # 0 ■ m ¥ II

e modificar o modo de visualização do gráfico. Existem parâmetros adicionais


que você pode usar com o comando p lo t3 d (. . .). Para maiores detalhes,
acesse a tela de ajuda deste comando:

?plot3d

Para desenhar algumas curvas de nível de uma função de duas variáveis,


você deve primeiro carregar a biblioteca gráfica plots^ com o comando

w ith ( p lo ts ) :

Feito isto, você terá acesso ao comando c o n to u rp lo t(. . .), que desenha
curvas de nível. Por exemplo, o comando
co n to u rp lo t(x "2 - y"2, x = - 5 . . 5 , y = - 5 . . 5 ,
contours = [-10, -5 , 0, 5, 10],
g rid = [40, 40]);

irá desenhar as curvas de nível de z = /(x ,y ) = associadas aos


níveis z = —10, z = —5, z = 0, z = 5 e z = 10 no retângulo [—5,5] x [—5,5]
(veja a figura (B.4)). O parâmetro g rid = [40, 40] está relacionado com a
B.7 Visualizando gráficos, curvas e superfícies de nível 569

Figura B.3: Gráfico da função z = f { x , y ) = definida no retângu­


lo [-5 ,5 ] X [-5 ,5 ] gerado porMaple V.

precisão do método numérico que Maple V usa para desenhar curvas de nível.
Você pode especificar outros números naturais. Quanto maior o número,
melhor a precisão e também mais tempo será necessário para o cálculo das
curvas de nível. O parâmetro contours = [-10, -5 , 0, 5, 10], como
você deve imaginar, especifica quais os níveis que devem ser desenhados (no
caso, os níveis escolhidos são z = —10, z = —5, z = 0, z = 5 e z = 10).
Maiores detalhes: ?contourplot.

C U ID A D O ! C U ID A D O ! CU ID A D O !

Para executar o comando


co n to urplot(x"2 - y"2, x = - 5 . . 5 , y = - 5 . . 5 ,
contours = [-10, -5 , 0, 5, 10],
g rid = [40, 40]);
570 Ferramenta computacional: M aple V

Figura B.4: Curvas de nível da função z = f { x ^ y ) = associadas aos


níveis z = z = -5 , z = 0, z = 5 e 2: = 10 no retângulo
[-5,5] X [-5,5].

você precisará digitar em mais do que de uma linha! Para isto, digite
co n to u rp lo t(x "2 - y"2, x = - 5 . . 5 , y = - 5 . . 5 ,
e, no final, pressione a tecla SHIFT e, sem largá-la, pressione a tecla
ENTER, 0 que levará o cursor ao início da próxima linha (se você apenas
pressionar a tecla ENTER, Maple V tentará executar o seu comando que,
por estar incompleto, gerará uma mensagem de erro). A seguir, digite
contours = [-10, - 5 , 0, 5 , 10],
não esquecendo de usar a combinação SHIFT+ENTER no final da linha.
Por último, digite
g rid = [40, 40]) ;
e pressione a tecla ENTER para executar todo o comando.
B.7 Visualizando gráficos, curvas e superfícies de nível 571

Para desenhar uma superfície de nível de uma função de três variáveis,


você deve usar o comando im p lic itp lo t3 d (. . .) (não esqueça de carregar
a biblioteca gráfica plots se você ainda não o fez). Por exemplo, o comando
f := (2*x''2 + 7*^2 + z''2 - 1)^3 - (x''2*z''3)/lO - y’" 2*z''3:
im p lic itp lo t3 d (f = 1,
X = -1.2..1.2, y = -1.2..1.2, z = -1.0..1.5,
g rid = [60, 60, 60], co lo r = re d , axes = boxed,
s ty le = patchnogrid, lightm odel = l i g h t l ) ;

irá desenhar a superfície de nível da função

w = f{x, y, z) = (2 - 1)^ - 2^3


y z
IF
associada ao nível w = 1 no paralelepípedo

[-1.2,1.2] X [-1.2,1.2] X [-1.0,1.5].

Esta superfície é conhecida como superfície do coração (veja a figura (B.5)).

^ Êotof ^tO|eíí«in / ' i jíi r JífíndDW

loiEgjQpTnãi} [51^ {iffiFr^ir

Figura B.5: A superfície do coração.


572 Ferramenta computacional: Maple V

Com relação aos parâmetros adicionais, co lo r = red especifica que o de­


senho deve ser feito em cor vermelha, ajces = boxed especifica que os ei­
xos coordenados devem ser desenhados no formato de um paralelepípedo,
s ty le = patchnogrid especifica que as arestas das faces da triangulação da
superfície não devem ser desenhadas e, finalmente, lightm odel = l i g h t l
especifica uma configuração de iluminação predefinida. Maiores detalhes:

? im p lic itp lo t3 d e ? p lo t3 d [o p tio n s].

B.8 Calculando derivadas parciais

Maple V pode calcular derivadas parciais muito facilmente: basta usar o


comando d if f ( . . . ) . Por exemplo,

d i f f (cos(x''2 - y^'2), x ) ;

calcula a derivada parcial de cos(r^ —?/^) com relação à variável x:

2 sin(— x

Você pode combinar o comando d if f ( . . . ) com os comandos de atribuição


e simplificação para fazer cálculos de derivadas parciais muito rapidamente
e com pouco trabalho de digitação. Derivadas parciais de ordem superior
também podem ser calculadas. Reinicie o sistema com o comando r e s t a r t
e acompanhe a seqüência de comandos a seguir.
Para começar, vamos atribuir à variável f a expressão cos(x"2 - y"2).
> f := cos(x"2 - y " 2 ) ;

/ := cos(-x^ + y^)

Agora vamos calcular a derivada parcial de f com relação a x e atribuir o re­


sultado à variável df x e, analogamente, calcular a derivada de f com relação
a y e atribuir o resultado à variável df y usando o comando d if f ( . . . ) .

> dfx := d i f f ( f , x ) ;

dfx := 2 sin(— + y^) x


B.8 Calculando derivadas parciais 573

> dfy := di f f Cf , y ) ;

dfy := - 2 sin(-a;^ + y^) y

Vamos agora verificar o teorema de Young para a função de duas variáveis


f{x,y) = cos(x^ —y^), isto é, vamos verificar que fxy{^,y) = fyx{x,y) ou,
equivalentemente, que fxy{x,y) —fyx{x,y).

> diffCdfx, y) - diffCdfy, x ) ;

O cálculo acima pode ser feito diretamente com o uso da variável f, uma
vez que é possível calcular derivadas parciais de ordem superior diretamente
a partir da função original, sem a necessidade de variáveis auxiliares para
armazenar as derivadas de ordem mais baixa.

> diff(f, X, y) - diff(f, y, x);

Para terminar, considere a função g{x,y) = {x + y)/ {x"^ + y^). Vamos usar a
variável g para armazená-la.

> g := (x + y)/(x~2 + y^S) ;

x+ y
9 ■■= -|- y^
Vamos agora derivar g com relação a x usando o comando d if f (,

> diff(g, x ) ;

+r )
Observe que a resposta não está na forma de uma fração, isto é, a resposta
não está em sua forma mais simplificada. Você pode ainda combinar os
comandos sim p lif y (. . .) e d i f f ( . . . ) para obter uma resposta simplificada
diretamente.
574 Ferramenta com putacional: M aple V

> simplifyCdiff(g, x));

—x^ + y^ — 2xy
(x2 + j/3)^

B.9 Visualizando curvas e superfícies param etrizadas

Para desenhar o traço de uma curva parametrizada plana, você deve usar
0 comando p lo t ( . . . ) . Por exemplo, o comando
plot([t*cos(t), t*sin(t), t = 0..3*Pi]);

irá desenhar o traço da espiral


oc{t) = (í cos(í),í sen(í)),
para í 6 [0,3 tt] (veja a figura (B.6)).

J gíte gárt JiJfew gwjectoí


'a w i o i é í i M g i^~ _ j
«3^027 IRvHlõlIõlQWyEl

rTÍmer '2-Ii' íBÍÃÍsíÍV,’3ÊW’íiviátebfe.t34G/m ‘Í

Figura B.6: Traço da curva param etrizada a{t) — (cos(í), sen(í)) p ara t no
intervalo [0,37 t].
B.9 Visualizando curvas e superfícies parametrizadas 575

Para desenhar o traço de uma curva parametrizada no espaço, você deve


usar 0 comando spacecurve(. . .) (não esqueça de carregar a biblioteca
gráfica plots se você ainda não o fez). Por exemplo, o comando
spacecurveC [ c o s ( t ) , s i n ( t ) , t ] , t = 0 . . 3*Pi , co lo r = b lack ,
axes = boxed, sc a lin g = c o n s tra in e d );

irá desenhar o traço da hélice Cí{t) = (cos(í), sen(í),í), para t no intervalo


[0, 3 7t] (veja a figura (B.7)). O parâmetro

s c a lin g = constrained]

especifica que uma mesma escala deve ser usada para os eixos y e z.

ifíew âíjíte S^íor è w £r<?]eceon JâJíníJw


iD icgiai^triãl isJâJUJláJ "' I
l i l ________ _________ :

^ fTán®3.5$ fcVlTzSM

Figura B.7: Traço da curva param etrizada a{t) = (cos(t), sen{t),t) para t no
intervalo [0, S tt].

Para desenhar a imagem de uma superfície parametrizada no espaço, você


deve usar o comando p lo t3 d ( . . .). Por exemplo, o comando
576 Ferramenta computacional: M aple V

phi := [ ( 5 +2 * c o s (v ))* c o s (u ), ( 5 +2 * c o s ( v ) ) * s in ( u ) , 2 * s i n ( v ) ] :
p lo t 3 d (p h i, u = 0 . . 2 *P i, V = 0 . . 2 *Pi,
s c a lin g = con strain ed , axes = b oxed );

irá desenhar a imagem da superfície parametrizada

v) = ((5 + 2 cos(í;)) cos('u), (5 + 2 cos(t^)) sen(ti), 2 sen(u))

para {u^v) E [0, 2 7t ] x [0,2 7t


]) (um toro, veja a figura (B.8)). Para maiores
detalhes: ? p lo t 3 d.

Maple V Release 5 - Icdfvv.mws]


« S p e £dít ^lew fpjma! JJolof ^xes ^ojedjon / SirifKÍDw J|etp iJsjxj

"3

mK liSSTST A»jíWileí,356/J5%
ê

Figura B.8: O toro.

B.IO Calculando gradientes, jacobianas e hessianas

Os comandos que calculam o gradiente, a jacobiana e a hessiana de uma


função fazem parte da biblioteca lin a lg de Álgebra Linear. Antes de poder
B.IO Calculando gradientes, jacobianas e hessianas 577

usá-los, você precisa carregar esta biblioteca. O comando que faz isto é:

with(linalg):

Entre outros comandos, a biblioteca lin a lg disponibilizará os procedimentos


g r a d ( . . .), jacobianC . . .) e h e s s ia n ( . . .) que calculam, respectivamente,
o gradiente, a jacobiana e a hessiana de uma função. Lembre-se que só faz
sentido calcular o gradiente e a hessiana de funções escalares^ isto é, funções
cujo contradomínio é R. Vamos ver como usar estes comandos com três
exemplos a seguir.

E xem plo B .l Para calcular o vetor gradiente da função escalar

w = f { x , y, z) - i/a ;2 + í/2 + 22,

de três variáveis, basta usar o comando

gradCsqrt (x"2 + y"2 + z"2) , [x, y, z]);

Neste caso, Maple V irá devolver como resultado:

X y z
H - q . ^2 ’ ^ y2 ^ -f + 2:^

Exem plo B.2 Para calcular a matriz jacobiana da função vetorial

(r, 5 , t) = f(x , y) = {xé^ + cos{y), x , x + e ^ ),

definida de R^ para R^, basta usar o comando

jacobianC [x*exp(y) + cos(y), x, x + exp(y)] , [x, y] ) ;

Neste caso, Maple V irá devolver como resultado a matriz 3 x 2 :

xé^ — sin(y)
1 0
1 ey
578 Ferramenta computacional: Maple V

Exem plo B.3 Para calcular a matriz hessiana da função escalar de três
variáveis definida por

w = f { x , y , z ) = a;V 2 ^

basta usar o comando

hessian(x"2*y"2*z"2, [x, y, z] );

Neste caso, Maple V irá devolver como resultado a matriz 3 x 3 :

2 2/^z^ 4 xyz‘^ 4 xy^^z


Axyz^ 2 x ^ ^ AiX^yz
^xy^z Ax‘^yz

Como era de se esperar pelo teorema de Young, esta matriz é simétrica, uma
vez que / é uma função de classe C^.
Apêndice C

Respostas de alguns exercícios

O bservação: lembre-se que as respostas dadas abaixo não estão completas,


pois é preciso justificá-las cuidadosamente.

Capítulo 1

[01] Falsa.

[02] Falsa.

[03] Falsa.

[04] Verdadeira.

[05] Falsa.

[06] Falsa.

[03] Variáveis de controle: x é a quantidade em toneladas de minério de


ferro da usina 1, j/ é a quantidade em toneladas de minério de ferro da
usina 2 e z é a quantidade em toneladas de minério de ferro da usina 3.

Maximizar J5(x, y, z) = 8 ■x • y • z'^ — 200000 • {x + y + z)


sujeito às restrições: x + y + z = 1000, x > 0, J / > 0 e z > 0.

[04] Variáveis de controle: x é a quantidade de alumínio em toneladas, y é


a quantidade de ferro em toneladas e z é a quantidade de magnésio em
toneladas.
580 Respostas de alguns exercícios

Maximizar C(x, 2/, z) = 12 • X + 8 • y + 16 • 2:


sujeito às restrições: x + y + z = 1000, x > 0 , y > 0 e z > 0 .

[05] Variáveis de controle: xi é a quantidade em kg/mês do produto I, X2 é


a quantidade em kg/mês do produto II, X3 é a quantidade em kg/mês
do produto III e 0:4 é a quantidade em kg/mês do produto IV.

Maximizar C(xi, X2, 2:3, 2:4) = 10 • + 8 • X2 + 9 • X3 + 8 • X4


sujeito às restrições: 5 • xi + 4 • X2 + 8 •2:3 + 9 • X4 < 80,
2 •2:1 + 8 •X2 + 8 •X4 < '2 0 ,
2• + 4 • 2^2 4" 2 •2:3 + 8 *2:4 ^ 40,
7 • 2 :1 + 3 • X2 + 7 • 2 : 4 < 40,
xi > 70, X2 > 80, 2:3 > 40, X4 > 20.

Capítulo 3

[02] Observe que o gráfico de = f {x, y) = —x^ —y^ pode ser obtido pela
reflexão do gráfico de z — g{x^y^ = com relação ao plano xy.
[06] Fazendo a interseção do gráfico de z = f[x^y) = x^/a^ + y^/6^ com
planos da forma x = k^y = k ^ e z = k obtemos parábolas, parábolas e
elipses, respectivamente. Como temos mais parábolas do que elipses, o
nome do gráfico de / é parabolóide elíptico.
[07] Fazendo a interseção do gráfico de z = = 2:^ —y^ com planos da
forma x = k^y = k , e z = k obtemos parábolas, parábolas e hipérboles,
respectivamente. Como temos mais parábolas do que hipérboles, o nome
do gráfico de / é parabolóide hiperbólico.
[08] As curvas de nível de z = y(x, y) = 2 • x • y associadas aos níveis z = k
diferentes de zero são hipérboles y = k/ { 2 -x). A curva de nível associada
ao nível z = 0 é formada pelo par de retas y = —x/2 e y = x / 2.
[09] As curvas de nível de z = /(x ,y ) = max{|xl, |y|} associadas aos níveis
z = k maiores do que zero são quadrados com vértices (fc, A;), (—fc. A:),
{—k^—k) e (A;,—A:). A curva de nível associada ao nível z = 0 é o
conjunto formado pelo único ponto (0, 0). As curvas de nível associadas
aos níveis z = k menores do que zero são formadas pelo conjunto vazio.
581

[10] (a) A reta y = —x + 10 é a curva de nível de / passando pelo ponto


(8, 2) e a reta y = —x + 1 é d, curva de nível de / passando pelo
ponto (—2, 3).
(b) A reta y = —x + (a + ò) é a curva de nível de / passando pelo
ponto (a, 6). Observe que se 6 > —a então o ponto (a, 6) pertence
ao domínio de / .
(c) Se ?/ = —X + 2 então /(x , y) — /(x , —x + 2) = In —l) =
In (e^ —l) = constante.
(d) A reta y = —x + 3,

[11] O domínio de / é o conjunto

I {y ^ ^ ^ y > — ^) ou {y > X e y < —x)} .

As curvas de nível de / associadas aos níveis z = k negativos são forma­


das pelo conjunto vazio e as curvas de nível associadas aos níveis z = k
maiores ou iguais a zero são as retas
1-k^
y = X.
l+ P

[13] O domínio de / é o conjunto |(x , y) E | y 7^ x + / • tt, com / G Z}.


As curvas de nível associadas aos níveis z = k com k no intervalo aberto
(—1, 1) são formadas pelo conjunto vazio e as curvas de nível associadas
aos níveis z = k com A ; < —l o u f c > l são as retas

y= X —arcsen ( ^ ) + 2 • Z• tt

y = X — ( 7T—arcsen ( - ) ) + 2 • Z• tt, com ZG Z.

[23] (a) F{x,y) = y-x' ^, (b) F{x,y) = y - f { x ) , (c) F{x, y, z) = z - x ^ - y ' ^ ,


(d) F{x, y, z) = z - f{x,y).

[24] (a )-(2 ), (b )-(5 ), (c )-(4 ), ( d ) - ( 6), ( e ) - ( l ) , ( f ) - ( 3 ) .

[25] As superfícies de nível não podem se interceptar.

[27] Como f {x, y) = > 0 = / ( 0 ,0) para todo {x,y) G segue-se


que (0, 0) é mínimo global de /.
582 Respostas de alguns exercícios

[28] Como / ( l , 0) = 1 > 0 = /(O, 0) segue-se que (0, 0) não é máximo global
e como / ( 0 , 1) = —1 < 0 = /(0,0) segue-se que (0,0) não é mínimo
global.

[29] Como vimos no exercício resolvido (3.1), nos pontos da reta y = —x +


In (l + e^) a função / é constante e igual a k. Logo, / pode assumir
qualquer valor real k e, portanto, / não possui extremos globais.

[30] Como vimos no exemplo (3.3), existem superfícies de nível apenas para
níveis k entre 0 e 3. Assim, os pontos da superfície de nível associada
ao nível A; = 0, a esfera de centro na origem (0,0,0) e raio r = 3
são os pontos de mínimo global de / . Da mesma maneira, o ponto da
superfície de nível associada ao nível fc = 3, o conjunto formado pelo
ponto (0, 0, 0), é o único ponto de máximo global de /.

[31] A superfície de nível associada ao nível k é o parabolóide elíptico de


revolução z = x ‘^ + y'^ + k. Como vimos no exemplo (3.4), nos pontos do
parabolóide elíptico de revolução ^ = x^ + j/^ + A;, a função / é constante
e igual a k. Logo, / pode assumir qualquer valor real k e, portanto, /
não possui extremos globais.

Capítulo 4

[09] (a) O conjunto não é fechado, não é aberto, é limitado e não é com­
pacto. Seu interior é o conjunto vazio e sua fronteira é o conjunto
{{x,y) - l < a ; < l e y = 0}.
(b) O conjunto é fechado, não é aberto, não é limitado e não é compacto.
Seu interior é o conjunto vazio e sua fronteira é igual ao próprio
conjunto.
(c) O conjunto é fechado, não é aberto, não é limitado e não é compacto.
Seu interior é o conjunto vazio e sua fronteira é igual ao próprio
conjunto.
(d) O conjunto não é fechado, é aberto, não é limitado e não é compacto.
Seu interior é igual ao próprio conjunto e sua fronteira é a reta
{(^j 2/) ^ IK^ I X + y = 1^.
(e) O conjunto é fechado, não é aberto, não é limitado e não é compacto.
Seu interior é o conjunto vazio e sua fronteira é igual ao próprio
conjunto.
583

( f ) 0 conjunto é fechado, não é aberto, não é limitado e não é compacto.


Seu interior é o conjunto vazio e sua fronteira é igual ao próprio
conjunto.
(g) O conjunto é fechado, não é aberto, é limitado e é compacto. Seu
interior é o conjunto {(x, y) E | 1< < 2} e sua fronteira
é o conjunto {(x,y) E | x^ + y^ = 1 ou x^ + y^ = 2}.
(h) O conjunto não é fechado, é aberto, é limitado e não é compacto.
Seu interior é igual ao próprio conjunto e sua fronteira é o conjunto
{{x,y) 6 1 + ?/^ = 2 ou {x,y) = (0,0)}.
( i ) O conjunto é fechado, não é aberto, não é limitado e não é compacto.
Seu interior é o conjunto {(x,y) E | 1 < x < 2} e sua fronteira
é o conjunto {(x,y) E | x = 1 ou x = 2}.
(j ) O conjunto não é fechado, não é aberto, não é limitado e não é com­
pacto. Seu interior é o conjunto vazio e sua fronteira é o conjunto
{(^) y) 1X = 0 ou y = o}.
[10] O conjunto é compacto.
[11] Vamos mostrar que D = {x E | /i(x) = c} é um conjunto fechado.
Para isto, devemos mostrar que se x„ E i? e x„ —> p então p E D.
Como x„ E jD, segue-se que h[yin) = c c. Por outro, como h é
contínua, h{-Xn) h{p). Logo h{p) = ce, portanto, p E D. Os mesmos
argumentos podem ser usados para mostrar que {x E | h{x) < c}
também é um conjunto fechado.

[14] E possível aplicar o teorema de Weierstrass apenas nos itens (a), (c),
(e),(f),(g)e(i).

[26] Sim.

C apítulo 5

[01] Use MuPAD ou Maple para conferir os seus cálculos.


[02] Use MuPAD ou Maple para conferir os seus cálculos.
[03] (a) é 0 gráfico de d f / d y , (b) é o gráfico de d f / d x e (c) é o gráfico de
/•
[05] Use MuPAD ou Maple para conferir os seus cálculos.
584 Respostas de alguns exercícios

[06] Use MuPAD ou Maple para conferir os seus cálculos.


[08] Apenas as funções dos itens (a), (c) e (e) são harmônicas, isto é, satis­
fazem a equação de Laplace.
[11] z — A = —4 {y — 2) no plano x = 1.
[12] 2{x + y)z.
[14] /i( 0 ,0) = /j,(0,0) = 1, 5 i(0 ,0) = 1 e 5i(0, y) = - 1 para yj^O.
[15] (a) fx{x,y) = - ln(sen(a;)) e fy{x,y) = ln(sen(i/)).
(b) fx{x,y) = e fy{x,y) =
[16] gx{x, y,z) = z + x^ Çy{x, y,z) = 0 e

g^{x,y,z) = x + e"

[20] {df/dx){x, y) = g'{x) ■h{y) e [df/dy){x,y) = g{x) ■h'{y).


[22] d‘^ f / dx^ denota a derivada parcial de segunda ordem com relação a x
enquanto que (df/ dx)^ denota a derivada parcial de primeira ordem
com relação a x elevada ao quadrado. Em geral, estas duas quantidades
são diferentes. Por exemplo, se /(x , y) = x^+y^ então {d'^f/dx^){x, y) =
2 enquanto que [{df/dx){x, y)' f = 4x^.
[24] (a) Falsa, (b) Falsa.
[25] (a) Falsa, (b) Falsa.

Capítulo 6

|01] (a )-(4 ), (b )-(6 ), (c )-(5 ), (d )-(3 ), ( e ) - ( l ) , ( f ) - ( 2 ) .

|02] (a )-(5 ), (b )-(6 ), ( c ) - ( l ) , (d )-(3 ), (e )-(4 ), ( f ) - ( 2 ) .


[05] (6,5,6).
[06] (e + 5 ,-3 ).
[09] (a) ot[t) = (t,2t) para t 6 [0,1].
(b) a(<) = para t € [—1,1].
(c) a (í) = (í^/4, í) para í 6 M.
585

(d) (x{t) = (cos(í), \/2 sen(t)) para í E M.


(e) cx{t) = (1, —3t, —2 + 3t) para t E [0,1].
(f) a (í) = (2 cos(í), 2 sen(í), 10 —4 cos(t) —2sen{t)) para í E M.
(g) a (í) = {x{t),y{t),z{t)), onde

x{t) = \ / S/2 cos{t) — 1/2,


y{t) = ^ f t j 2 sen(t) - 1/2,
z{t) — 2 — \ f 3 f 2 cos(t) —a/ 3/2 sen(í),

para í E M.

[10] Dica: use as propriedades da derivada de uma função de Cálculo I para


as funções coordenadas das curvas parametrizadas oc e (3.

[12] Você verá vários segmentos de reta! Este fato tem uma conseqüência
muito interessante: suponha que você vivesse em um mundo cilíndrico
e quisesse descobrir o caminho de menor comprimento que une dois
pontos sobre o cilindro. Evidentemente, estamos considerando apenas
os caminhos que ficam sobre 0 cilindro! Não vale, por exemplo, pegar
um segmento de reta ^‘que passa por fora” do cilindro. Para encontrar
este caminho mínimo (em linguagem de Geometria Diferencial, uma
geodésica)^ basta fazer o que se segue.

(a) Desenhe os dois pontos, P i e P 2, sobre o cilindro.


(b) Corte o cilindro por uma reta r paralela ao eixo ^ que passa por um
dos pontos, digamos, P i.
(c) Abra a folha de papelão sobre uma mesa plana.
(d) Na folha de papelão aberta, podemos considerar o ponto P i como
estando tanto no lado esquerdo quanto no lado direito do retângulo
(veja a figura). Escolha 0 ponto P i mais próximo de P 2 e desenhe
um segmento de reta (uma geodésica do plano euclidiano) unindo
os dois pontos.
(e) Cole de volta a folha de papelão.
586 Respostas de alguns exercícios

Não é difícil ver que o caminho mínimo sobre o cilindro unindo P i e P 2


será uma hélice (veja a figura) ou um segmento de reta (caso os dois
pontos do cilindro estejam sobre uma mesma reta r paralela ao eixo z)
ou uma circunferência (caso os dois pontos do cilindro estejam a uma
mesma altura com relação ao eixo z)\
Existe toda uma teoria para se determinar as geodésicas de uma su­
perfície geral. Normalmente, esta teoria é desenvolvida em um curso
de Geometria Diferencial. Indicamos ao leitor interessado no assunto
o livro Elementary Topics in Differential Geometry, de J. A. Thorpe
(referência [75] da bibliografia).

[15] (a) a " ( í ) - ( 0 ,0 ) .


(b) a "(í) = (2,2).
(c) a"{t) — (2 cos(í),3 sen(í)) = —a (í).
(d) a"(í) = (0,2,6í).

[18] Apenas as transformações dos itens (c), (e), (f), (g), (i), (j) e (k) são
transformações lineares.

[20] T (4 ,-3 ) = (8,5).

[21] Dica: mostre que T(a;,y) = {2x,2x + y).

[22] Fi(x, y) = (2X, 2 X + y) e F 2(x, y) = (2x^, 2 x^ + y^).

[23] (a) T (l, 0,0) = (-1 ,1 ,0 ), T (0 ,1,0) = (1,0, -1 ), T (0 ,0,1) = (1, -1 ,0 ).


587

-1 1 1
(b) A = 1 0 -1
1 - 1 0
(c) T (l,2 ,3 ) = ( 4 , - 2 , - l ) .
[24] A função F é linear. Justificativa geométrica; convença-se, fazendo
alguns desenhos, que F (u -H v) = F(u) F(v) e F(A • u) = A • F(u),
para todo u, v G e para todo A E R. Justificativa algébrica; mostre
que F(x, y) — {x, —y), para todo (x, y) € R^.
[25] A função F é linear. Justificativa geométrica; convença-se, fazendo
alguns desenhos, que F(u-|-v) = F(u)-|-F(v) e F(A-u) = A-F(u), para
todo u, v E R^ e para todo A E R. Justificativa algébrica; mostre que
F{x,y) = (cos(0) X —sen(0) y,sen{9) x+cos{9)y), para todo (x,i/) E R^.
[28] Basta observar que se existe x E R" tal que T(x) ^ 0 então T pode
assumir qualquer valor real. Para ver isto, seja A: E R e considere
y = k/ T( x) ■X. Temos que T(y) = T(A:/T(x) • x) = k/T{x.) ■T(x) = k.
Como T pode assumir qualquer valor real, segue-se que T não pode
possuir nem mínimo global e nem máximo global.
[36] (a) (l)-(c), (2)-(d), (3)-(a) e (4)-(b).
[38] (a) Helicóide-(2), Parafuso de Steinbach-(4), Guarda-chuva de W hitney-
(3), Superfície de Enneper-(l).
[39] (a) Sim! De fato, a é de classe pois

a '(í) = (3í^, 2í), para todo í E R.

Observe que o traço de a (veja a figura (6.3)) possui um “bico” no


ponto (0,0).
(b) Não! De fato, / não é derivável na origem pois

„„/(íW E = M íiíízi = 1 = + 00 .
rc->0 + X —0 x->0 + X — 0 x->0 +
Observe que o gráfico de / (veja a figura (6.3)) possui um “bico”
no ponto (0, 0).
(c) Falsa! Moral da história: não é porque o traço de uma curva para­
metrizada possui um “bico”, que ela perde a propriedade de ser de
classe C^.
588 Respostas de alguns exercícios

Capítulo 7

[01] 2 = -30640 + 4041 x + 450 y.


[02] /(10.36,1.04) w 11692.76.
[03] /(9 9 8 ,101.5) 6037.
[04] /(4 .2 ,7.05,1.02) « 3.040972223.
[05] g (9 9 8 ,128) « 1510.
[06] Porque / e p possuem o mesmo plano tangente no ponto (0,0).
1 0
[07] (a)
0 1
xe^ —sen(j/)
(b) 1 0
1
1 1
(c) 2xy x"^ 0
2/(1 + xy) a; (1 + xy)
(d) sen{y) x cos(y)
5 2/^ 10 xy

e® 0
[08] (a)
y cos{xy) x cos{xy)x
1 -1 0
(b)
0 1 1
1 1
(c) -1 1
y X
1 0 1
(d) 0 1 -5
1 -1 0
589

[09] Se a (í) = (3 + 8 í , 3 —2í), T[x^y) = x^cos(j/) —2/^sen(x) e / = T o a


então

^ ( í ) = (48 + 128í)cos(3 - 2í) - 2 (3 + 8í)^sen(3 - 2 t ) ~


8 (3 - 2 t f cos(3 + 8 í) + (12 - 8 í) sen(3 + 8 í).

[10] (a) Se a (í) = (e‘, e“‘) e h = f o a então

^ ( í ) = (e^* - e-2‘) (2 In - l) .

(b) Se a (í) = (t, —t) e h = f o a então

dh
^ ( í ) = ( l + 4í^)e^*-.

(c) Se a (í) = (cos(í), sen(í), t) e h = f o a então

^ ( í ) = 2 í + 2 sen(í) cos(í) —sen(í).


CLL
(d) Se a{t) = (í, e h = f o a então

^ ( í ) = e*-*' ((3 - 2 í) e2‘ + í (2í2 _ í _ 2)).

[11] Se a (í) = (e‘, e*^),


, . X y z
u{x,y,z) = - 4----- h -
y z X
e h = u o a então

dh _ (1 - 2í) + (3 í 2 - 1) e‘'Pt+i) + ^ (2 _ 3^) e‘(2‘+i)


pt(<^+í+i)

[12] Se a (í) = (í^ + 1,t^), u{x,y) = sen(xy) e h = uocx então

^ ( u ) =t ^ (5 í + 4) COS (í^ (í + 1)).

[13] Se X = g{u), y = h{u), a{t) = {g{u),h{u)), z{x,y) = x^ + y'^ + 2xy^ e


f = zo a então
590 Respostas de alguns exercícios

g{u)g'{u)-\-h{u)h'{u)
^df( u ) = ^ ^ -|- 2 g'[u) {h{u))^ + 4^(u) h{u) h'{u).
du

[14] Temos — (x^) = (In(rr) + 1).


dx
[15] Se ct{x) = (x, e h{x) = ( / o a)(x) então o termo dw/ dx no lado es­
querdo da equação acima é um abuso de notação para dh/dx^ enquanto
que o termo dw/dw no lado direito da mesma equação é um abuso de
notação para d f /dx. Assim, a mesma expressão dw/dx está represen­
tando duas coisas diferentes (pois f e h são duas funções diferentes) e,
portanto, não podemos efetuar o cancelamento sugerido pelo enunciado
do problema.

[16] 3960.
[17] 3960.
[18] [ 3960 -148000 ]^^^.

2u + 2v 2u + 2v
[19]
0
[20] Temos

(f o g)(a;, y) = (^tg {e^ ^ - (x -

(1 + tg2(e^-2' - 1 ) ) é^-y - (1 + - 1)) e^-y


D{fog){x,y) =
2 { e ^ - y f - 2 x + 2y - 2 {e^~yf+ 2 x - 2 y

[21] Temos (fog)(x,í/) = {hi{x,y),h 2{x,y)) com

h{x,y) =
h 2{ x , y ) = cos {c os {x — y) + e^) + seií{e^ + c os { x — y) + e~ y) ,

an{x,y) an{x,y)
D{f og){x, y) =
a2i{x,y) a22{x,y)
591

com aii(x,y) = ®”, ai2(x,y) = e ®” e


^21(2:, y) = —sen(cos(x - y) + e®) ( - sen(x - y) + e®) +
cos(e^ + cos(x — y) + e~^) (—sen(x —j/) + e^),
022(x,y) = —sen(cos(x —y) + e^) sen(x —?/) +
cos(e^ + cos(x —y) + e~^) (sen(x — y) — e~^).

[22] Basta observar que

R (x ) = (S o T )(x ) = S (T (x )) - S ( 2l • x) = S • • x) = (B • • X.

[23] Temos
dF dw. dw ,
^ - ^ ( y - 2 : , y + a;) + - ^ ( 2 / - x , y + x),
dF dw. dw
= + ^ ( 2/ - a ; , 2/ + x) + — ( y - x , y + x).

[24] Temos

|J(M) = f(g(M ))-f(M ) + |(g{M ))-f(M ).

|(M ) = |ffe(M ))-f (M) + |(g(M ))-f(M ).


[25] Temos
dh,
s,t) = S,í))' ■ — (n s,t) + s,í)) , £ » ( r s,í) +
= vM '- ar' ’

s,í)). s,í),
9r ^ ’
dh,
s,t) = s,í)). s,í) + s,t)) , ^ ( r s, í) +
a / ’ as' ’

S,í)). s,í),

dh. « / í í s,í)).^ ( r s, í) + d f , ,
s,í) = s,t))' , ^ ( r s,t) +
w * ’'-
^5 3 .
t s,í)) • s,í).
592 Respostas de alguns exercícios

[26] Temos
dh, 1 s,t)) ■ ^ ( r s,t) ± . ? B , r s,t),
s,t)) ■
& < « < ’■' dr ’ ar' ’
dh,
s,t)) • ^ ( r s,t) + M i r
s,t)) ■ S, t ) ,
ds ^ ’ ds''
dh, df, . df, .
s,t)) s,t) + s , t ) ) ' ■ ^ í r S, t ).
ãi'*’’" dt ^ ’ m ''

)(0,2) = 6 e { d F / d v ) { 0 , 2 ) = -11.

- 2G -= -2.

[29] (a) 365 kg. (b) ±11%.

[34] (a) Falsa, (b) Falsa, (c) Verdadeira.

[35] (a) Falsa, (b) Falsa.


[36] (a) Falsa, (b) Falsa, (c) Verdadeira.
[37] (a) Falsa, (b) Falsa.

[38] (c) Sim, de grau 3. (e) Não. (g) Dica: usando a regra da cadeia,
derive os dois lados da equação (7.22) e faça í = 1. A recíproca desta
proposição é verdadeira, mas ela é mais difícil de se provar.

Capítulo 8

[01] (a) V f { x , y , z ) =
± ^ ^2 ’ J
(b) V /(x , y,z) = {y + z , x + z , x + y).
(c) V /(x ,y ,z ) = (l,2í/,3z^).
(d) V /(x , y, z) = ± 2 xz, 2 xy ± z^, 2 yz ± x^).

(f) V f ( x , y ) = ^3 x \/x 2 ± y2, 3y \/x 2 ± y 2 j.

(g) V / ( x , y ) = ( ( l± 2 x 2 ) e " ’+2'\2xye"'+S'').


593

[02] (a) - 1 1 - 1 6 ^ .
(b) - l/5 ^ /5 .
(c) 17V2/2.
(d) -4 /5 .

[03] (a) -1 4 \/3 /3 .


-10101
(b) 218( v/3/3.
(c) 1/8 7T- 1/2.
(d) -V e/196.

[04] (a) (2,4).


(b) (2 ,-4 ).
(c) (sen(l), cos(l)) ou, ainda, (e sen(l),e cos(l)) = e (sen(l),cos(l)).
(d) (e sen(l) + e~^ cos(l),e cos(l) + e~^ sen(l)).

[05] ( e - \ 2 e - ^ , - 3 e ^ ) .

[06] (a) 0.00452/\/2).


(b) (0.00260,0.00192).
(c) (-0.00260, -0.00192).
(d) Descendo a uma taxa de —0.00192.
(e) Descendo a uma taxa de —0.00068/v^.

[07] Resposta: No ponto (1,1), a direção em que a altitude cresce mais


rapidamente é (—a, —b). Se uma pedra fosse largada no ponto (1,1) ela
começaria a rolar na direção do vetor (a, 6).

[08] Dica: use a definição de vetor gradiente junto com as propriedades da


derivada com relação à soma, produto e divisão de funções.

[09] ( 3 ^ /Í Õ /1 0 ,^ /1 0 ) .
594 Respostas de alguns exercícios

[10] Temos

(V) KC) _ h{E), (V) h{A) > KC),

(F ) > 0, (V) > 0,


>

(V) < 0, (F ) < 0,


> >

(V) > 0, (F ) < 0,


> >

(F ) > ^ ^ ( F) (F ) >
>

[11] (a) Falsa, (b) Falsa, (c) Verdadeira.

[12] (a) Falsa, (b) Falsa.

[13] (a) Falsa, (b) Falsa, (c) Verdadeira.


[14] (a) Falsa, (b) Falsa.

[19] (a) F{x,y) = V /( x , í/), onde f {x, y) = xy. (b) F(x) = V /(x ), onde
/(x ) = -A;/I|x||^.

Capítulo 9

[01] (c) /'(5) = -1 /1 0 . (d) y = 5/2 - x/lO.

[02] (f) O exercício não constitui um contra-exemplo para o teorema da


função implícita para pois o ponto p = (0,0) não satisfaz a hipótese
{dF/dx)[p) ^ 0 ou (dF/dy){p) ^ 0 exigida pelo teorema.
[03] (b) m = -1 .

[05] - 4 1 - a ; + 15y = 0.
[06] f (-2 ) = 1.

[08] (a) y = 3. (c) y = 1 -h 4 xi/9 — 2 X2/9.

[09] (b) /x (l,0 ) = -11/16 e fy{l,0) = 3/16. (c) z = 2 7 /1 6 - lla;/16-t-


3y/16.
595

[10] (b) / ,( 1 ,0) = - 1 e /,( 1 ,0) = 5/7. (c) ^ = 19/7 - o: + 5 y/7.


[11] Para x* = 10001 temos y* ^ 624.8125 a fim de que F^x*,y*) = 20000.
[12] Dica: considere a superfície de nível de F{x, y, z) = z — f {x, y) que
passa pelo ponto {x*,y*, f{x*^y*)).
[14] (a) 11X + 7 2/ + 3 2: = 38. (h) w = —21 + l l x + 7y + 3z.
[15] (a) 16x + l l y = 27. (a) z = -2 1 + 16a: + l l y .
[16] (b) \/3a:/6 + \Z3y/9 + \/3z/12 = 1. (c) x*x/a? + y*y/tí^ + z*z/c^ = 1.
[22] Dica: considere o sistema x^y^ = 50, x + y = 125 ou, melhorainda,
considere o sistema a ln(a:) + b ln(y) = ln(50), x + y = 125.

Capítulo 10
[02] Como f { x, y) = + 2/^ > 0 = /(0,0) para todo {x,y) G segue-se
que (0, 0) é mínimo global de / .
[03] Como / ( l , 0) = 1 > 0 = /(O, 0) segue-se que (0,0) não é máximo global
e como /(0 ,1 ) = —1 < 0 = /(0 ,0 ) segue-se que (0,0) não é mínimo
global.
[04] Como vimos no exercício resolvido (3.1), nos pontos da reta y = —x +
In (1 -f e^) a função / é constante e igual a k. Logo, / pode assumir
qualquer valor real k e, portanto, / não possui extremos globais.
[05] Como vimos no exemplo (3.3), existem superfícies de nível apenas para
níveis k entre 0 e 3. Assim, os pontos da superfície de nível associada
ao nível = 0, a esfera de centro na origem (0, 0, 0) e raio r = 3
são os pontos de mínimo global de / . Da mesma maneira, o ponto da
superfície de nível associada ao nível k = 3, 0 conjunto formado pelo
ponto (0, 0, 0), é o único ponto de máximo global de / .
[06] A superfície de nível associada ao nível k é o parabolóide elíptico de
revolução z = x"^ + y‘^ + k. Como vimos no exemplo (3.4), nos pontos do
parabolóide elíptico de revolução z = x^^ + y^^ + k, a, função / é constante
e igual a k. Logo, / pode assumir qualquer valor real k e, portanto, /
não possui extremos globais.
[08] E possível aplicar o teorema de Weierstrass apenas nos itens (a), (c),
(e),(f), ( g ) e ( i ) .
596 Respostas de alguns exercícios

[09] (a) Falsa, (b) Falsa, (c) Falsa, (d) Verdadeira, (e) Falsa, (f) Falsa,
(g) Falsa, (h) Falsa, (i) Falsa, (j) Falsa, (k) Falsa.
[10] (a) Verdadeira, (b) Verdadeira.
[16] (a) Verdadeira, (b) Falsa.
[18] (a) Verdadeira, (b) Verdadeira, (c) Falsa, (d) Falsa.
[19] (a) Falsa. Mostre que z = f { x, y) = xy é um contra-exemplo.
(b) Falsa. Mostre que z = f {x, y) = {y — x"^){y — 3x^) é um contra-
exemplo.
(c) Falsa. Mostre que z = f (x, y) = xy é um contra-exemplo.
(d) Verdadeira.

C apítulo 11

[01] (a) Falsa, (b) Verdadeira, (c) Falsa, (d) Verdadeira.


[02] (a) Verdadeira, (b) Falsa, (c) Verdadeira, (d) Falsa.
[05] (a) Não. (b) Sim. (c) Não. (d) Sim. (e) Não. (f) Não. (i) O ponto
(2,2,2,2,2,2,2,2,0).
[06] Os pontos p e r são mínimos locais de / , q é ponto de sela de / e s não
é ponto crítico de / .
[07] O ponto p é ponto de sela de / , o ponto q é ponto de máximo local
de / , o ponto r é ponto de mínimo local e o ponto s não é ponto crítico
de / .
[08] Os pontos p e r são mínimos locais de / , q é ponto de sela de / e s não
é ponto crítico de / .
[09] ps(x) = 1 + X + x^/2 -f x^/6 e pi{x) = 1 4- x -1- x^/2 -l- x^/6 -f x^j2A.
P3(0.2) = 1.221333333..., p3(l-0) = 2.6666666..., P4(0.2) = 1.2214 e
P4(1.0) = 2.70833333....
[10] P2{x) = 8 -f 3 (x - 4) -I- 3 (x - 4)2/16 e P2(4.2) = 8.6075.
[11] Para /(x ) = \ / l + x temos pi(x) = 1-1- x/2, P2 {x) = 1 -f x/2 —x^/8,
ps{x) = l + x/2-x2/8-f-xV l6,P i(0.2) = 1.1,P2(0.2) = 1.095, P3(0.2) =
1.0955. Para g{x) = ln(x) temos pi(x) = x — 1, P2 (x) = (x — 1) —
597

(x - 1)72, pz{x) = (x - 1) - (x - 1)72 + (x - 1)73, pi(1.2) = 0.2,


P2(1-2) = 0.18 e ^3(1.2) = 0.182666666 —

[12] (a) pi(x, y) = x e p 2{x, y) = x - x - y .


(b) pi(x, y) = 1 + X e p 2{x, y) = l + x + x^/2 + y^/2.
(c) pi(x, y, z) = - 1 /4 + x/2 + y/4 + z/2 e p 2{x, y, z) = x/4 + y/2 +
z/4 —3x^/32 + xz/lQ + xy/8 —3z^/32 —y^/8 + j/7S-
(d) pi(x,y) = k —ka—k b +k a x +k a y e p 2 {x,y) = k + —3 k a / 2 —Skb/2+
ka^/2 + kab + 2 + 2 fca x —kab x —ko?x + 2kby —káb y — y +
ka^ X?12 — ka x^/2 + kb^ y^ j 2 — kb y^/2 + kab xy.

[13] P2{x,y) = x/2 + y/2 - (x - 1)78 - (y - 1)7^ + (x - l)(y - l)/2 e


P2(1.2,0.9) = 1.03875.

[14] p 2{x, y) = 3/4 + x/2 - y/4 + x^/4 - x(y - l)/4 + (y - 1)^/8.

[24] (a) Positiva-definida, (b) Indefinida, (c) Negativa-definida, (d) Indefi­


nida. (e) Indefinida.

[25] Falsa.

[26] (a) Verdadeira, (b) Verdadeira.

[27] (a) Falsa, (b) Falsa, (c) Verdadeira, (d) Falsa, (e) Verdadeira.
(f) Falsa.

[28] Verdadeira.

[29] (a) Verdadeira, (b) Falsa.

[30] (a) Verdadeira, (b) Verdadeira.

[35] Existem

n n\
Jt ) k\{n — k)\

menores principais de ordem k < n.

[36] (a) Verdadeira, (b) Verdadeira, (c) Verdadeira, (d) Verdadeira.

[37] (a) Falsa, (b) Verdadeira, (c) Falsa, (d) Verdadeira.


598 Respostas de alguns exercícios

[38] (a) (0,0) é ponto de sela de / , (1,0) é ponto de sela de / , (—1,0) é


ponto de sela de / , (0,1) é ponto de sela de / , (\/5 /5 ,2/5) é ponto
de mínimo local de / e (—\/5 /5 ,2/5) é ponto de máximo local de / .
(b) (13/7,16/7) é ponto de sela de / .
(c) (0,0) é ponto de sela de / , (1,1) é ponto de mínimo local de f e
( - 1 ,- 1 ) é ponto de mínimo local de / .
(d) (0,0) é inconclusivo, (1 /2 ,—1/2) é ponto de mínimo local de / e
(—1/2, —1/2) é ponto de mínimo local de / .
[39] (a) (-369/137,-14/137,29/137) é ponto de sela d e / .
(b) (0,0,0) é ponto de mínimo local de / .
[40] Os pontos críticos de / são (0,0) (mínimo local de /), (—1,0) (ponto
de sela de / ) e (2,0) (máximo local de /) .
[41] (a) O único ponto de mínimo local de / é (0,0). A função / não possui
máximos locais.
(b) A função não possui extremos locais.
(c) O único ponto de mínimo local de / é (0,0) e os únicos pontos de
máximo local de / são (—-s/3,0) e (+-\/3,0).
(d) Os únicos ponto de mínimo local de / são (--^ 1 /2 , +-^^1/2) e
(+ 7 1 7 2 , - ^ ) e os únicos pontos de máximo local de / são
( - - ^ 172, - V l / 2) e
(e) O único ponto de mínimo local de f é (1,1) e o único ponto de
máximo local de / é (0, —1).
(f) O único ponto de mínimo local de / é (1,0) e o único ponto de
máximo local de / é (—1,0).
[42] (a) Existem três pontos críticos:
(0,0,0), ( + 1 /2 ,- 1 /4 ,- 1 /4 ) e ( - 1 /2 ,+ 1 /4 ,- 1 /4 ) .
(b) (0,0,0) é um ponto de sela, (+ 1 /2 ,—1 /4 ,—1/4) é um ponto de
mínimo local e (—1/2, +1/4, —1/4) é um ponto de mínimo local.
[45] (a) Falsa, (b) Falsa.
[46] Dica; mostre que (xo,?/o) é ponto de sela de / .
[48] (a) A função / não possui extremos globais.
599

(b) A função / não possui extremos globais.


(c) (0, 0) é o único ponto de mínimo global de / . Não existem pontos
de máximo global de / .
(d) A função / não possui extremos globais.
[49] (a) A função / não extremos globais.
(b) (0, 0,0) é o único ponto de mínimo global de / . Não existem pontos
de máximo global de / .
[52] Nenhuma das funções é convexa ou côncava.
[53] (a) Convexa, (b) Côncava, (c) Convexa, (d) Nem convexa e nem
côncava.
[54] (a) Falsa, (b) Verdadeira.
[55] (a) Falsa, (b) Falsa, (c) Falsa, (d) Falsa, (e) Falsa, (f) Falsa.
(g) Falsa, (h) Verdadeira.
[61] (a) Use o teorema (11.14). (b) Use o item (a) e o exercício [57].
[62] (a) Use a definição de convexidade e a desigualdade triangular, (b) Use
o item (a) e o exercício [exer:f:conv:subnivel].
[65] A sentença é falsa! Mostre que U = Q é um contra-exemplo.
[67] Dica: utilize o teorema (11.9) para atacar o caso n = 1 primeiro. Use
então o exercício [exer:convexidade:segmento] para estabelecer o resul­
tado para o caso geral.
[68] (c) Use o item (b) com f{x) = - ln{x), pi = xi, P2 = • • •, Pn =
e a i = a 2 = ' — = a n = l / n . a \ = a 2 = * * • = a n = 1/^-

[70] (a) Verdadeira! Dica: use a definição de convexidade de funções ou o


teorema (11.14). (b) Falsa!
[71] = 9x/10 + 6/5.

Capítulo 12
[01] Os pontos r e s são máximos globais de / em D. Note que /( r ) = /(s).
Os pontos p e q são mínimos locais de / em D. Agora, ou p, ou q
ou ambos são mínimos globais dependendo do valor da função / nesses
pontos.
600 Respostcis de alguns exercícios

[02] O ponto (+ \/2/2, +V2/2) é máximo global o ponto [—y/2j2^ —\/2/2) é


mínimo global de /(x , y) = a; + y sujeitos à restrição — 1.

[03] (a) O ponto (0 ,-1 ) é mínimo global de f{x^y) = x^^ + y sujeito à


restrição + y^ = 1. Os pontos (—\/3 /2 ,1/2) e (+ \/3 /2 ,1/2) são
máximos globais de /(x, y) = a:^ + y sujeitos à restrição x^ + y^ = 1.
(b) Os pontos (0, —1) e (\/3 /2 ,1/2) são admissíveis com /( \ / 3 / 2 ,1/2) =
5/4 > {l+s/2)/2 = / ( ^ / 2 , V2/2) e /(O, -1 ) = - 1 < (l+ \/2 )/2 =
/(\/2/2,-\/2/2). Logo (\/2/2, v^/2 ) não é máximo global e nem
mínimo global de / em D.
(c) Dica: mostre que (v^/2, \/2/2) satisfaz a condição de regularidade,
mas não satisfaz as condições de primeira ordem para valor algum
do multiplicador A. Conclua usando o teorema dos multiplicadores
de Lagrange.

[04] O ponto (1,0) é mínimo global de /(x, y) = x + y^^ sujeito à restrição


( x- 2)2 + y2 = 1. Os pontos (5 /2 ,-V ^ /2 ) e (5 /2 ,+ \/3 /2 ) são máximos
globais de /(x , y) = x + y^ sujeitos à restrição (x —2)^ + y^ = l.

[06] A distância mínima é \/2 e a distância máxima é \/6.

[07] Use Maple V ou MuPAD para encontrar as raízes da cúbica 2 x^ —x + 2


que aparece no sistema. O ponto da parábola y = x^ mais próximo
de (2,1) é

1 (l08 + 6v/3Í8)^^% 6 I (^(108 + 6 7 3 1 8 )^ ^ ^ 6 )


«y*) = 2/3
6 \/l0 8 + 6 v/318 36 (108 + 6 7318)

[08] (a) Posto 2.


(b) Posto 2.
(c) Posto 3.
(d) Posto 4.

[09] M tem posto 2 para a 7 0 e ò / 0, posto 1 para (a = 0 e 6 6 M) ou


(a 7 0 e ò = 0) e não existem valores de o e 6 para os quais M tenha
posto 0.

[10] A sentença é verdadeira.


601

[11] Verdadeira.
[12] (x*,2/*,2:*) = (4 /3 ,-2 /3 ,1 /3 ).

[13] Os pontos (1/ 2, 0, —\/3/2) e (1/ 2, 0, \ / 3/ 2) são máximos globais e o


ponto (—1, 0, 0) é mínimo global de /(x , z) = x + y + no conjunto
admissível determinado pelas restrições + y‘^ + z^ = 1 e y =
[14] (a) Apenas o ponto (1,0) é admissível.
(b) Nenhuma restrição está ativa no ponto (7,7), apenas a terceira res­
trição está ativa no ponto (5,16), apenas a segunda restrição está
ativa no ponto (7,0), apenas a segunda e terceira restrições estão
ativas no ponto (1, 0).
(c) No ponto (1, 0) estão ativas a segunda e terceira restrições, de modo
que a matriz formada pelos gradientes destas restrições
0 1■ ■0 1 ■ r\j ’ 0 1 '
_ - 2 • (xi - 1) 1 _ (ll,l2) =(l,0) _0 1 _ _0 0_
tem posto 1. Assim, o ponto (1, 0) não satisfaz a condição de regu­
laridade do teorema de Karush-Kuhn-Tucker.
(d) Sim, pois as funções g\{xi, X2) = - x i , 52(2^1, X2) = —X2 e g^{xi, X2) =
^2 — {x\ — 1)^ são côncavas, uma vez que suas matrizes hessianas
são negativas semideíinidas em todo .

[15] (a) Apenas o ponto (1, 1) não é admissível.


(b) No ponto (2, 2) estão ativas as segunda e quarta restrições, no
ponto (1, 2) estão ativas as quarta e quinta restrições, no ponto (1, 0)
estão ativas as segunda e quinta restrições, no ponto (1/4,1/4) não
existem restrições ativas.
(c) O ponto (1, 0) não satisfaz e o ponto (2, 0) satisfaz a condição de
regularidade.
(d) Sim pois as funções g\{xi,X2) = - x i , 52(2^1, 2^2) == xi, 53(2^1, 2^2) =
—2^2, 54(2:1, X2) = X20 55(0:1, 0:2) = —(xi —1)^—(0:2—1)^ são côncavas
uma vez que suas matrizes hessianas são negativas semidefinidas
em
(e) O conjunto admissível é formado pela região entre 0 círculo de centro
em (1, 1) e raio 1 e o quadrado [0, 2] x [0, 2] sendo, portanto, um
conjunto compacto.
602 Respostas de alguns exercícios

[17] (a) 2, (b) 1, (c) 1 6 (d) ^ 2.


[19] Dica: mostre que (0,0,4) satisfaz a condição de regularidade mas não sa­
tisfaz as condições de primeira ordem. Use então o teorema de Karush-
Kuhn-Tucker.
[23] Dica: mostre que p satisfaz a condição de regularidade mas não satisfaz
as condições de primeira ordem do problema de otimização. Use então
0 teorema de Karush-Kuhn-Tucker.
[26] O ponto (0, 2) é máximo global de / no conjunto admissível determinado
pelas restrições.
[27] O ponto (0, 1) é máximo global de / no conjunto admissível determinado
pelas restrições.
[28] x* = 5 e y * = 15.
[29] x* = 0 e y * = l.
[30] a;* = 28/37 e y* = 86/37.
[31] (a) Temos:
y z — Al • 2 • X —A2
X •z — Al • 2 • 2/ —As;
x-y-\-l —
Al —A4,
{x"^ + + z — 6) — 0,
A2 • X = 0,
h-y = 0,
A4 • z = 0,
Al > 0,
A2 > 0,
As > 0,
A4 > 0,
x'^ + y'^ + z < 6,
X > 0,
y > 0,
z > 0.
(b) A restrição x^^ + y’^ + z < 6 deve estar sempre ativa em qualquer
solução do problema.
(c) X = 0, 2/ = 0, z = 6, Al = 1, A2 = As = A4 = 0.
603

(d) Temos;
y-z = 2 ■{x ■y + 1) ■X,
X- z = 2 •{x •y + 1) ■y,
z = 6 — x^ — y^.
(e) Verifique que os valores x = l , y = l e 2 = 4 satisfazem o sistema
dado no item (d).
[32] (b) Dica: use a condição de regularidade alternativa.
[33] A caixa tem base 2 • y a j i por 2 • ^ a / A e altura {fãjA .
[34] xi = / • a /p i e y = - I • (- 1 + a)/p 2.
[35] Temos;

d ■a d-b d •c
{x*,y*,z*) =
/ '

[36] Mostre que {x*)"^ = (y*)^ = (z*)^ = c/3.


[38] Falsa.
[39] (a) Falsa, (b) Verdadeira, (c) Falsa.
[41] (c) Verdadeira.
[44] (a) Falsa, (b) Falsa, (c) Falsa.
Notações e convenções 605

NOTAÇOES E CONVENÇÕES

No texto, Cálculo / significa Cálculo Diferencial e Integral de Funções de Uma Variável e


Cálculo II significa Cálculo Diferencial de Funções de Várias Variáveis.
A representação decimal de um número real usa ponto no lugar de virgula. Assim, a
representação decimal de 12137/2000 é 6.0685 e não 6,0685.

O bjetos vetoriais (pontos, vetores, funções vetoriais) são representados em negrito. Objetos
escalares são representados em itálico.

O símbolo ■ indica o final de um a demonstração, exemplo, ou exercício resolvido.

N O

Z 0

Q 0

E 0

E" 0

IMI A

fx(a,b) A

/a;x(U) à) A

fxyifi-) A

Composição de funções.

L>f(p) A m atriz jacobiana de f no ponto p.

^ (P ) A derivada direcional de / no ponto p na direção do vetor v.

V /( P ) O vetor gradiente de / no ponto p.

^V(P) A m atriz hessiana de / no ponto p.

O menor principal líder de ordem k da m atriz A.


Bibliografia

[01] T. M. Apostol, CalculuSj Volume //, Second Edition, John Wiley &
Sons, New York, 1969.

[02] G. Ávila, Um Problema de Otimização no Desenho de Foguetes, Ma­


temática Universitária, 7, 1988, pp. 55-66.

[03] M. Avriel, W. E. Diewert, S. Schaible e W. T. Ziemba, Introduction to


Concave and Generalized Concave Functions, Generalized Concavity in
Optimization and Economics, Academic Press, Inc., pp. 21-50, 1981

[04] M. S. Bazaraa e C. M. Shetty, Nonlinear Programming, Theory and


Algorithms, John Wiley & Sons, New York, 1979.

[05] P. Beaumont, Mathematics for Microeconomics, Lecture Notes, Florida


State University, 2001.

[06] A. Ben-Tal e A. Nemirovski, Convex Optimization in Engineering: Mo-


deling, Analysis and Algorithms, Lecture Notes, Faculty for Industrial
Engineering and Management, Israel, 1998.

[07] M. Berger, Coniques et Quadriques, Cubo Matemática Educacional,


vol. 2, pp. 122-156, 2000.

[08] D. P. Bertsekas, A. Nedic e A. E. Ozdaglar, Convexity, Duality and


Lagrange Multipliers, Lecture Notes, MIT, 2001.

[09] K. Black, Putting Constraints in Optimization for the First-Year Cal-


culus Students, SIAM Review, vol. 39, no. 2, pp. 310-312, 1997.

[10] C. Bajaj, J. Blinn, J. Bloomenthal, M. Cani-Gascuel, A. Rockwood,


B. Wyvill e G. Wyvill, Introduction to Implicit Surfaces, Morgan-
Kaufmann, 1997.
608 Bibliografia

[11] H. J. Bortolossi, Operação Hidrotérmica de um Sistema com Uma


Usina Hidroelétrica e Várias Usinas Térmicas^ Tese de Doutorado,
Departamento de Matemática, PUC-Rio, 1999.
[12] S. Boyd e L. Vandenberghe, Convex Optimization^ Lecture Notes, Win-
ter Quarter, 2001.
[13] C. B. Boyer, A History of Mathematics^ Second Edition, John Wiley
& Sons, New York, 1991.
[14] C. B. Boyer, The History of the Calculus and its Conceptual Develop-
ment, Dover Publications, Inc., New York, 1949.
[15] E. Bradley, Optimization an Human Movimenta SIAG/OPT Views-
and-News, vol. 12, no. 1-6, 2001.
[16] A. J. V, Brandão, M. A. Rojas-Medar e G. N. Silva, Uma Introdução
às Funções Invexas Diferenciáveis com Aplicações em Otimização, re­
latório técnico, UNIGAMP, 1999.
[17] M. P. do Garmo, Differential Geometry of Curves and Surfaces, En-
glewood GlifFs, Prentice-Hall, 1976.
[18] P. G. P. Garvalho, L. H. Figuereido, J. Gomes e L. Velho, Métodos
de Otimização em Computação Cráfica, 22- Golóquio Brasileiro de
Matemática, Rio de Janeiro, IMPA, 1999.
[19] A. G. Ghiang, Fundamental Methods of Mathematical Economics, Se­
cond Edition, McGraw-Hill Kogakusha, Ltd., Tokyo, 1974.
[20] A. Giriani e R. G. Leachman, Optimization in Industry: Mathematical
Programming and Modeling Techniques, John Wiley & Sons, New York,
1993.
[21] G. S. Ghristensen, M. E. El-Hawary e S. A. Soliman, Optimal Con-
trol Applications in Electric Power Systems, Plenum Press, New York,
1987.
[22] M. Goronato, Meu Negócio é Números, Revista Negócios Exame,
pp. 30-21, março, 2001.
[23] M. Graizer, L. G. Nonato e G. Tavares, Cálculo Integral em Várias
Variáveis, Apostila, Projeto MatMídia, PUG-Rio, Rio de Janeiro,
2000.
Bibliografia 609

[24] D. Crowe e H. Zand, Computers and Undergraduate Mathematics I:


Setting the Scene^ Computers & Education, no. 35, pp. 95-121, 2000.

[25] D. Crowe e H. Zand, Computers and Undergraduate Mathematics 2:


On the Desktop, Computers & Education, no. 37, pp. 317-344, 2001.

[26] D. Crowe e H. Zand, Computers and Undergraduate Mathematics 3:


Internet Resources, Computers & Education, no. 35, pp. 123-147, 2000.

[27] R. R Cysne e H. A. Moreira, Curso de Matemática para Economistas,


Editora Atlas, São Paulo, 1997.

[28] J. Czyzyk, T. Wisniewski e S. J. Wright, Optimization Case Studies


in the NEOS Cuide, SIAM Review, vol. 41, no. 1, pp. 148-163, 1999.

[29] A. Dax, An Elementary Proof of Farkas^ Lemma, SIAM Review,


vol. 39, no. 3, pp. 503-507, 1997.

[30] J. E. Dennis Jr. e R. B. Schnabel, Numerical Methods for Unconstrai-


ned Optimization and Nonlinear Equations, Classics in Applied Mathe-
matics, 16, SIAM, 1996.

[31] L. A. Fernandez, On the Limits of the Lagrange Multiplier Rule, SIAM


Review, vol. 39, no. 2, pp. 292-297, 1997.

[32] M. C. Perris e J. S. Pang, Engineering and Economic Applications of


Complementary Problems, SIAM Review, vol. 39, no. 4, pp. 669-713,
1997.

[33] G. K. Francis, A Topological Picturebook, Springer-Verlag, New York,


1987.

[34] G. H. Golub e C. F. V. Loan, Matrix Computations, Third Edition,


The Johns Hopkins University Press, Baltimore, 1996.

[35] M. B. Gonçalves e D. M. Flemming, Cálculo B, Funções de Várias


Variáveis, Integrais Duplas e Triplas, Makron Books, São Paulo, 1999.

[36] M. Goossens, F. Mittelbach e A. Samarin, The BTpjX Companion,


Addison-Wesley, 1998.

[37] M. Goossens, S. Rahtz e Frank Mittelbach, The BTgK Graphics Com­


panion, Addison-Wesley, 1997.
610 Bibliografia

[38] T. A. Grandine, Applications of Contouring, SIAM Review, vol. 42,


no. 2, pp. 297-316, 2000.

[39] A. Heck, Introduction to Maple, Second Edition, Springer-Verlag, New


York, 1996.

[40] D. Hilbert e S. Cohn-Vossen, Geometry and Imagination, Chelsea Pu-


blishing Company, New York, 1952.

[41] D. M. Himmelblau, Applied Nonlinear Programming, McGraw-Hill


Book Company, New York, 1972.

[42] W. Kaplan e D. J. Lewis, Cálculo e Álgebra Linear, Livros Técnicos


e Científicos S. A. e Editora Universidade de Brasília, Rio de Janeiro,
1973.

[43] T. H. Kjeldsen, A Contextualized Historical Analysis of the Kuhn-


Tucker Theorem in Nonlinear Programming: The Impact of World
War II, Historia Mathematica, 27, 2000, pp. 331-361.

[44] M. S. Klamkin, Problems in Applied Mathematics, Selections from


SIAM Review, SIAM, Philadelphia, 1990.

[45] A. P. Knoerr, A Dynamical Proof of the Method of Lagrange, SIAM


Review, vol. 40, no. 4, pp. 941-944, 1998.

[46] L. Lamport, A Document Preparation System, Addison-Wesley,


1994.

[47] E. L. Lima, Análise Real, Volume I, Coleção Matemática Universitária,


IMPA, Rio de Janeiro, 1989.

[48] E. L. Lima, Curso de Análise, Volume 2, Terceira Edição, Projeto


Euclides, IMPA, Rio de Janeiro, 1989.

[49] E. L. Lima, Álgebra Linear, Coleção Matemática Universitária, IMPA,


Rio de Janeiro, 1995.

[50] S. Lipschutz, Topologia Cerol, Coleção Schaum, McGraw-Hill, Rio de


Janeiro, 1971.

[51] D. G. Luenberger, Linear and Nonlinear Programming, Second Edi­


tion, Addison-Wesley Publishing Company, 1989.
Bibliografia 611

[52] N. Maculan, M. Minoux e G. Plateau, An 0{n) Algorithm for Projec-


ting a Vector on the Intersection of a Hyperplane and , Recherche
opérationnelle/Operations Research, vol. 31, no. 1, pp. 7-16, 1997.

[53] I. Malta, S. Pesco e H. Lopes, Cálculo /, Apostila, Projeto MatMídia,


PUC-Rio, Rio de Janeiro, 2000.

[54] O. L. Mangasarian, Nonlinear Programming^ McGraw-Hill Book Com-


pany, New York, 1969.

[55] J. Marsden e A. Weinstein, Calculus ///, Springer-Verlag, New York,


1980.

[56] J. E. Marsden e A. J. Tromba, Vector Calculus, Third Edition, W. H.


Preeman and Company, New York, 1988.

[57] M. B. Monagan, K. O. Geddes, K. M. Heal, G. Labahn e S. M. Vor-


koetter, Maple V Release 5 Programming Cuide, Springer-Verlag, New
York, 1998.

[58] A. C. Moretti e M. A. Rojas-Medar, Condiciones Suficientes de Opti-


malidad en Programación No Lineal, Cubo Matemática Educacional,
vol. 3, no. 2, pp. 129-146, 2001.

[59] G. Mullineux, Constraint Resolutin Using Optimisation Techniques,


Computers & Graphics, no. 25, pp. 483-492, 2001.

[60] I. Niven, Maxima and Minima Without Calculus, Dolciani Mathema-


tical Expositions, no. 6, The Mathematical Association of America,
1981.

[61] J. Nocedal e S. J. Wright, Numerical Optimization, Springer Series in


Operations Research, Springer Verlag, New York, 1999.

[62] G. Nord, D. Jabon e J. Nord, The Global Positioning System and The
Implicit Function Theorem, SIAM Review, vol. 40, no. 3, pp. 692-696,
1998.

[63] W. Oevel, F. Postei, Wehmeier e J. Gerhard, The MuPAD Tutorial,


Paderborn, Germany, 2000.

[64] D. Pinto e M. C. F. Morgado, Cálculo Diferencial e Integral de Funções


de Várias Variáveis, Editora UFRJ, Rio de Janeiro, 1997.
612 Bibliografia

[65] K. Polthier, Mathematical Visualization and Online Experiments^ Te-


chnical Report, Technische Universitát, Berlin, 2000.

[66] K. Polthier, S. Khadem, E. Preufi e U. Reitebuch, JavaView Reference


Manual, 2001.

[67] G. V, Reklaitis, A. Ravindran e K. M. Ragsdell, Engineering Opti-


mization: Methods and Applications, John Wiley & Sons, New York,
1983.

[68] L. Riddle, Individualized Computer Investigations for Multivariable


Calculus, Technical Report, Departament of Mathematics, Agnes Scott
College, 2001.

[69] R. T. Rockafellar, Fundamentais of Optimization, Lecture Notes, De-


partments of Mathematics and Applied Mathematics, University of
Washington, Seattle, 1997.

[70] P. Schultz, History of Mathematics, Lecture Notes, University of Wes­


tern Australia, 1999.

[71] C. P. Simon e L. Blume, Mathematics for Economists, W. W. Norton,


New York, 1994.

[72] D. M. Simmons, Nonlinear Programming for Operations Research,


Prentice-Hall, International Series in Management, 1975.

[73] M. Spivak, Calculus on Manifolds, A Modern Approach to Classical


Theorems of Advanced Calculus, W. A. Benjamin, New York, 1965.

[74] J. Stewart, Cálculo, Volume II, quarta edição. Pioneira, Thomson Le-
arning, 2001.

[75] J. A. Thorpe, Elementary Topics in Differential Geometry, Undergra-


duate Texts in Mathematics, Springer-Verlag, New York, 1979.

[76] R. J. Vanderbei, A Case Study in Trajectory Optimization: Putting


on an Uneven Green, SIAG/OPT Views-and-News, vol. 12, no. 6-14,
2001.

[77] V. M. Tikhomirov, Stories about Maxima and Minima, Mathematical


World, volume 1, American Mathematical Society, 1990.
Bibliografia 613

[78] E. R. Tufte, The Visual Display of Quantitative Information^ Graphics


Press, Cheshire, Connecticut, 1997.
[79] P. Wessel e W. H. F. Smith, The Generic Mapping Tools (GMT): A
Map-Making Tutorial^ University of Hawaih at Mãnoa and Laboratory
for Satellite Altimetry (NOAA/NESDIS/NODC), 2001.
[80] S. Williamson, Notes on Macroeconomic Theory^ Lecture Notes, Uni­
versity of lowa, 1999.
[81] A. J. Wood e B. F. Wollenberg, Power Generation and Controls Second
Edition, John Wiley & Sons, New York, 1996.
[82] W. I. Zangwill, Nonlinear programming: A Unified Approach^ Prentice-
Hall, Inc., Englewood Cliffs, 1969.
índice
Condição de regularidade, 462, 463, 472,
Adição de vetores, 45 475
Álgebra linear, 204 Condições
Ativa (restrição), 486 de prim eira ordem, 371, 462, 463, 472,
Atled, 311 475
Autovalor, 394, 450 de segunda ordem, 375, 391
Autovetor, 450 Cone, 108
Conjunto
B aberto, 149
Base canônica, 206, 294 admissivel, 352
Bernoulli compacto, 146
Jakob, 216 convexo, 414
Johann, 215 de nível, 201
Bola fechado, 145
aberta, 142, 145 lim itado, 143
fechada, 143 Continuidade, 121, 124, 128
Braquistócrona, 215 Coordenadas, 40
baricêntricas, 68
C cilindricas, 227
Campo
esféricas, 226
conservativo, 310
polares, 225
escalar, 187 Cosseno hiperbólico, 215
gradiente, 298 Curva
vetorial, 187, 228 comprimento de arco de uma, 212
C apital, 167 curvatura de uma, 220
Centróide, 69
de nivel, 97
Centro de massa, 69 definida implicitam ente, 189
Cholesky, decomposição de, 394 definida param etricam ente, 189
Ciclóide, 215 geratriz, 111
Circulação de um furacão, 246 integral, 231
Cobb-Douglas, 167, 176 param etrizada, 187
Combinação pelo comprimento de arco, 218
linear, 66, 206 regular, 218
linear convexa, 409 reparam etrização de uma, 218
Com pletam ento de quadrados, 393 torção de uma, 222
Composição de funções, 264 C urvatura de um a curva, 220
Comprimento
de arco, 212 D
de um segmento de reta, 50 Dantzig, George, 37
de um vetor, 54 Decomposição
616 índice

de Cholesky, 394 afim, 239


LU, 394 côncava, 409, 414
Del, 311 côncava para baixo, 409
Derivada côncava para cima, 409
de um a função vetorial, 256 conjunto de nivel de uma, 201
direcional, 296 continua, 121, 124, 128
parcial, 170 convexa, 409, 414
parcial m ista, 175 coordenada, 200
Desigualdade curva de nivel de uma, 97
de Cauchy-Schwarz, 159, 535 de classe 175, 202
de Jensen, 448 de classe C \ 175, 202
triangular, 61, 141 de classe 175, 202
Deslocamento, 42 de produção, 167, 176
Diferença de vetores, 47 escalar, 187
Distância, 50, 139, 157 estritam ente côncava, 447
estritam ente convexa, 447
E harmônica, 179
Eixo de revolução, 111 homogênea, 286
Eixos coordenados, 40 linear, 30
Elasticidade, 185 não-linear, 30
Elipsóide, 107, 347 objetivo, 24, 28, 352
Elipse, 104 par, 311
excentricidade de uma, 214 polinomial, 151
Enneper, superfície de, 236 subnivel de uma, 445
Equação superfície de nivel de uma, 101
da onda, 180 utilidade, 449
da reta tangente, 239, 335 vetorial, 187
de Korteweg-de Vries, 186
de Laplace, 179 G
diferencial, 231 Geodésica, 585
do calor, 185 Geometria Diferencial, 218, 585
do plano tangente, 243, 335 Globalidade, 113, 123, 129, 520
normal do plano, 70 GPS, 349
Escalar, 48 Gráfico de função
Espaço vetorial, 49 de duas variáveis, 83
E statística com parativa, 349 de um a variável, 80
Excentricidade de um a elipse, 214 G ra d ,311
Extrem o global, 113, 123, 129, 352, 520 Gradiente, 298
Guarda-chuva de W hitney, 236

Fórmulas de Serret-Frenet, 223 H


Farkas Hélice, 193
lema de, 514 Helicóide, 236
Ferm at, Pierre, 455 Hessiana, 382
Forma quadrática, 384 Hipérbole, 105
Fritz John, 485 Hiperbolóide elíptico
Fronteira de um conjunto, 144 de duas folhas, 108
Função de um a folha, 108
índice 617

Hiperfície de nivel, 104 de Newton, 288


Hiperplano, 71 de ponto interior, 34
Huygens, C hristiaan, 217 dos minimos quadrados, 420
M atriz
I hessiana, 382
Independência linear de vetores, 207 hessiana orlada, 515
Integral primeira, 231 indeflnida, 384
Interior de um conjunto, 148 jacobiana, 256
Isobárica, 119 menor principal de uma, 396
Isotérmica, 117 menor principal lider de uma, 396
J negativa definida, 384
Jacobiana, 256 negativa semidefinida, 384
propriedades da, 261 ortogonal, 453
Jensen, desigualdade de, 448 parte anti-sim étrica de uma, 439
John, Fritz, 485 parte sim étrica de uma, 439
positiva definida, 384
K positiva semidefinida, 384
Karush-Kuhn-Tucker Menor
teorem a de, 506 principal, 396
KdV, 186 principal lider, 396
Kepler, 455 Modelagem, 25, 26
KKT, 506 Modelo dinâmico, 264
Korteweg-de Vries, 186 M ultiplicação por um escalar, 47
Minimo
global, 113, 351
rH ôpital, 216 local, 352
Lagrangeano, 463
Lei N
da gravitação universal, 117 nabla, 311
de Amdahl, 184 V, 298
de Coulomb, 310 Newton
dos gases ideais, 118 método de, 288
Leibniz, G hottfried W ilhelm, 216 quociente de, 171
Lema de Farkas, 514 segunda lei de, 217
Limite de funções, 155 Norma de um vetor, 54, 62
Linha de fluxo, 231
LU, decomposição, 394 O
O ctante, 483
M Origem, 40
Máximo Ortogonalidade de vetores, 60
global, 113, 351
local, 352 P
Média Parâm etro
aritm ética, 103, 448 de um a curva param etrizada, 187
geométrica, 448 de um a superfície param etrizada, 233
Método Parabolóide
simplex, 34, 37 elíptico, 105
de Lagrange, 393 eliptico de revolução, 81
618 índice

hiperbólico, 93 Regressão linear, 420


Paradoxo de Simpson, 349 Reparam etrização de um a curva, 218
Parafuso de Steinbach, 236 Representação
Param etrização param étrica da reta, 63
de um a curva, 187 param étrica do plano, 67
de um a superfície, 233 Restrição
pelo comprimento de arco, 218 ativa, 486
Pesquisa operacional, 30 de um a função, 155
Plano, 106 R eta
cartesiano, 40 numérica, 39
equação norm al do, 70 representação param étrica da, 63
representação param étrica do, 67 tangente, 239, 335
tangente, 243, 335 Rotação, 224
Polinómio
caracteristico, 394, 450 S
de Taylor, 371 Sóliton, 186
Ponto Satisfação, 449
critico, 365 Sela
degenerado, 376, 391 de cachorro, 113
de acumulação, 155 de cavalo, 93, 113
de fronteira, 144 de macaco, 113
de sela, 369 Semi-espaço, 447
interior, 148 Seno hiperbólico, 215
Preço sombra, 537 Sensitividade, 537
Problem a Seqüências em R” , 156
da braquistócrona, 215 Serret-Frenet
da dieta, 26 fórmulas de, 223
da tautócrona, 217 triedro de, 221
do planejam ento hidrotérmico, 31 Simplex, 34, 37
P roduto Simpson, paradoxo, 349
escalar de vetores, 55 Soma de vetores, 45
interno de vetores, 55 Steinbach, parafuso de, 236
vetorial de vetores, 75 Stigler, George, 37
Program ação Subnivel, 445
linear, 30 Subtração de vetores, 47
não-linear, 30 Superfície
Propriedades cilindrica, 109
da derivada parcial, 173 de Enneper, 236
da m atriz jacobiana, 261 de nivel, 101
de revolução, 110
Q do coração, 571
Quociente de Newton, 171 eqüipotencial, 117
param etrizada, 233
R
Reflexão, 224 T
Regra Tautócrona, 217
da cadeia, 266 Teorema
de Ferm at, 365 da função implicita, 322, 325, 326, 343
índice 619

de Euler, 286
de Fritz John, 472, 485
de Karush-Kuhn-Tucker, 506
de W eierstrass, 123, 147
de Young, 176
dos multiplicadores de Lagrange, 462,
463, 472, 475
espectral, 453
fundam ental das curvas, 223
Torção de um a curva, 222
Toro, 119, 161
Traço de um a curva, 188
Trabalho, 167
Transformação
afim, 203
linear, 202, 203
Triedro de Serret-Prenet, 221

U
Unicidade
do máximo global, 447
do minimo global, 447
U tilidade m arginal, 449

Variável de controle, 24, 27, 33


Vetor, 44
aceleração, 217
binormal, 221
comprimento de um, 54
gradiente, 298
multiplicação por um escalar, 47
norm a de um, 54, 62
normal, 70
principal, 221
tangente a um a curva, 198
unitário, 219
unitário, 55
velocidade, 197
Viete, 455

W
W hitney, guarda chuva de, 236

Young, teorem a de, 176


Com um estilo coloquial, de fácil leitura, e com cerca de 250 ilustrações,
cuidadosamente geradas por computador, este livro traz a proposta
de apresentar os conceitos e técnicas de Cálculo Diferencial, usando
problemas de otimização como um forte elemento motivador. Muito
mais do que uma finalidade, a linguagem de otimização é extremamente
adequada para Introduzir os objetos fundamentais do curso. Entre as
características do livro, mencionamos:

• uso de argumentos geométricos que asseguram uma abordagem


mais intuitiva e elementar;
• estudo do caso geral de teoremas que habitualmente são feitos
apenas para funções de duas ou três variáveis, como a classificação
de pontos críticos de funções de /? variáveis;
• tratamento moderno da teoria de otimização, incluindo questões
de globalidade, convexidade e o teorema de Karush-Kuhn-Tucker;
• desenvolvimento da percepção geométrica tridimensional, com um
appiet JAVA desenvolvido especialmente para o livro: o aluno pode
girar, ampliar t>u encolher os gráficos de várias funções que
aparecem no texto;
• Inclusão de tutorlais direcionados para o curso de Cálculo
Diferencial, dos sistemas de computação simbólica Maple V e
MuPAD Light (sendo que este último pode ser obtido gratuitamente
na internet).

O texto nasceu da experiência do autor em lecionar a disciplina de


Cálculo Diferencial, desde 1995, para alunos de Economia, Engenharia,
Química, Física e Matemática da PUC-Rio.

PUC Bdições Loyoia

Você também pode gostar