Você está na página 1de 70

Exercı́cios de Cálculo Diferencial e Integral de Funções

Definidas em Rn

Diogo Aguiar Gomes, João Palhoto Matos e João Paulo Santos

24 de Janeiro de 2000
2
Conteúdo

1 Introdução 5
1.1 Explicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Futura introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Complementos de Cálculo Diferencial 7


2.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Cálculo diferencial elementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Derivadas parciais de ordem superior à primeira . . . . . . . . . . . . . . . . . . . . 19
2.3.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Polinómio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3 Extremos 27
3.1 Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2 Testes de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4 Teoremas da Função Inversa e da Função Implı́cita 47


4.1 Invertibilidade de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.1.1 Exercı́cios Suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Teorema do valor médio para funções vectoriais . . . . . . . . . . . . . . . . . . . . 52
4.3 Teorema da Função Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.1 Exercı́cios Suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4 Teorema da Função Implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.4.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

Bibliografia 69

3
CONTEÚDO

24 de Janeiro de 2000 4
Capı́tulo 1

Introdução

1.1 Explicação
Está a ler uma versão parcial e preliminar de um texto em elaboração. Os autores agradecem
quaisquer notificações de erros, sugestões,. . . , para ecdi@math.ist.utl.pt. Estima-se que o texto
final terá uma extensão cerca de três a quatro vezes maior e incluirá capı́tulos que nesta versão
foram excluı́dos.
A secção seguinte desta introdução tem carácter preliminar e tem como pressuposto a existência
do material que aqui ainda não foi incluı́do.
Partes deste texto foram distribuı́das separadamente por cada um dos autores no passado.
Tendo descoberto que os diversos textos tinham carácter algo complementar decidimos reuni-los.
A presente versão idealmente não mostra de uma maneira óbvia as adaptações e correcções que
foram necessárias para chegar ao formato actual.
Novas versões deste texto irão aparecendo sempre que os autores considerarem oportuno em
http://www.math.ist.utl.pt/~jmatos/AMIII/temp.pdf. Para evitar a proliferação de textos
obsoletos a maioria das páginas apresenta a data de revisão corrente em pé de página.

1.2 Futura introdução


Este texto nasce da nossa experiência a leccionar a disciplina de Análise Matemática III no Instituto
Superior Técnico. Por um lado reune um número considerável de enunciados de problemas de
exame e por outro serve de propaganda à nossa maneira de ver os assuntos aqui tratados. Análise
Matemática III é uma disciplina do primeiro semestre do segundo ano de todos os currı́culos de
licenciatura leccionados no Instituto Superior Técnico (IST) excepto Arquitectura.
Se se perguntar a um aluno de um dos dois primeiros anos do IST que tipo de “folhas” mais
deseja que lhe sejam disponibilizadas pelos seus professores temos como resposta mais que provável:
“folhas de exercı́cios resolvidos de Análise Matemática”. No entanto tal resposta costuma suscitar
como reacção da parte dos docentes essencialmente preocupação. De facto a resolução de exercı́cios
de Análise Matemática não é geralmente única e o processo de aprendizagem está mais ligado à
tentativa de resolução dos mesmos quando se possui um conjunto de conhecimentos mı́nimo do
que à absorção acéfala de um número finito de receitas.
O que se segue é uma tentativa de compromisso entre a procura e a oferta neste mercado
sui generis. São incluı́dos exercı́cios de exame dos últimos anos com modificações do enunciado
quando tal foi julgado conveniente e muitos outros com um carácter mais ou menos trivial, ou de
complemento de resultados citados, ou de comentário de uma resolução de um exercı́cio, sugestão
de extensões, etc. Por vezes um exercı́cio embora incluı́do numa secção inclui uma questão que
só é tratada numa secção posterior. Tais exercı́cios estão assinalados com um asterisco *. Foram
incluı́dos esboços de resolução e sugestões em número considerável.

5
CAPÍTULO 1. INTRODUÇÃO

O leitor deverá ter em consideração que o programa de Análise Matemática III tem variado
ao longo do tempo. É consensual no Departamento de Matemática do IST e na escola em geral
que a introdução à análise em Rn e o cálculo diferencial em Rn deverão ser tratados em grande
parte no primeiro ano do curso. Daı́ a existência de secções correspondentes a revisão de material
coberto no primeiro ano do curso.
Outro facto a ter em conta é a diferença de programa para os cursos de Matemática Aplicada
e Computação e Engenharia Fı́sica Tecnológica. Nestes cursos são introduzidos o formalismo das
formas diferenciais e a respectiva versão do teorema fundamental do cálculo em vez da formulação
clássica do teorema de Stokes. Aconselha-se os alunos destes dois cursos a comparar os enunci-
ados de exercı́cios deste tema com as formulações clássicas dos mesmos. Tais comparações estão
indicadas em nota de pé de página.
A notação utilizada é clássica tanto quanto possı́vel, embora obviamente não universal, e nem
sempre será isenta de incoerências. Por exemplo: usaremos a notação de Leibniz para  derivadas
∂2u ∂ ∂u
parciais mas de acordo com a notação geral para operadores, isto é, ∂x∂y = ∂x ∂y ; usaremos
RR RRR
, sempre que tal for considerado sugestivo.
Citaremos os resultados essenciais de cada tema mas não necessariamente com a sua formulação
mais geral remetida por vezes para observações marginais ou problemas. O enunciado de tais resul-
tados por vezes é seguido de uma “demonstração” que mais não faz que relembrar sinteticamente
a dependência em relação a outros resultados e os métodos utilizados.
Faz-se notar que não seguimos a ordenação de material geralmente adoptada durante a ex-
posição dos cursos no IST devido devido a razões como a conveniência em apresentar problemas
sobre a introdução do conceito de variedade como complemento do estudo do teorema da função
implı́cita.
Um último aviso: este texto não pretende substituir os excelentes livros de texto disponı́veis
sobre os assuntos aqui abordados. Diria mesmo que é provavelmente incompreensı́vel se um ou
mais desses livros não for consultado. Os textos adoptados no IST são [6, 3, 5].

Lisboa, Outubro de 1999

DG, JPM, JPS

24 de Janeiro de 2000 6
Capı́tulo 2

Complementos de Cálculo
Diferencial

O conceito de função diferenciável é uma das noções chave da análise. Por exemplo, se f : R → R
for diferenciável em x0 , o cálculo de f 0 (x0 ) permite aproximar f pela fórmula de Taylor perto de
x0 , i.e.,
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ),

onde limx→x0 o(x−x


x−x0
0)
= 0. Esta fórmula tem a seguinte interpretação geométrica: f 0 (x0 ) é o
declive da recta tangente a f em x0 e y = f (x0 ) + f 0 (x0 )(x − x0 ) é a equação dessa recta.
Outras aplicações do conceito de derivada familiares a um estudante que conheça Análise
Matemática ao nı́vel de um primeiro ano de licenciatura são, por exemplo, a determinação de
pontos de extremo: se f : R → R for diferenciável, os seus máximos ou mı́nimos são zeros de f 0 1 .
Outra aplicação que deve ser familiar é a mudança de coordenadas na integração através de:
Z b Z f −1 (b)
g(x)dx = g(f (y))f 0 (y)dy.
a f −1 (a)

Esta presença ubı́qua da diferenciação no estudo de funções reais de variável real faz com que
seja natural, quando se estudam funções de várias variáveis, generalizar a noção de derivada. Para
funções de Rn em R, a interpretação geométrica da derivada será o “declive” do “plano” tangente
ao gráfico da função, mais precisamente y = f (x0 ) + Df (x0 )(x − x0 ) é a equação desse “plano”
tangente2 .
Neste capı́tulo resumiremos alguns resultados de cálculo diferencial, para funções reais de mais
do que uma variável real. Em particular trataremos questões importantes sobre a continuidade e
diferenciabilidade de funções de Rn em Rm . Para além disso estudaremos a fórmula de Taylor.

2.1 Preliminares
Esta secção relembra alguns dos conceitos e resultados sobre funções de Rn em Rm que se supõem
conhecidos nas secções seguintes. Aconselha-se o leitor a consultar [1] para relembrar, com detalhe,
os resultados, supostos já conhecidos, que a seguir se enumeram de uma forma necessariamente
breve.
Tanto a definição de continuidade como a de diferenciabilidade dependem do conceito de dis-
tância entre dois pontos, definida por sua vez à custa da noção de norma:
1 Note, no entanto, que o facto de a derivada se anular num ponto, não implica que este seja um máximo ou
mı́nimo; pode ser ponto de sela! Veja o capı́tulo 3.
2 Designações técnicas para um tal conjunto são de um subespaço afim de dimensão n de Rn+1 ou hiperplano

7
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Definição 2.1.1 Seja η : Rn → R. Diz-se que η é uma norma se verificar as seguintes proprie-
dades:
i) η(x) > 0 se x 6= 0 e η(0) = 0;
ii) η(λx) = |λ|η(x), ∀x ∈ Rn , ∀λ ∈ R;
iii) η(x + y) ≤ η(x) + η(y), ∀x, y ∈ Rn .
Para designarmos uma norma genérica utilizaremos a notação kxk = η(x). Em Rn é usual
considerar a norma euclideana, definida por
q
k(x1 , . . . , xn )k = x21 + . . . + x2n .

Porém, em certas situações, pode ser útil trabalhar com normas diferentes.

Exercı́cio 2.1.1 Prove que as seguintes funções são normas em R2 :


1. η(x, y) = |x| + |y|
2. η(x, y) = máx {|x|, |y|}
p
3. η(x, y) = 2 x2 + y 2
p
4. η(x, y, z) = |x| + y 2 + z 2 .

Exercı́cio 2.1.2 Mostre que η(x, y) = |x + y| não é uma norma mas satisfaz ii e iii em 2.1.1.

Definição 2.1.2 Em Rn , a bola (aberta) centrada em x e de raio r, relativa à norma k · k, é o


conjunto B(x, r) (ou Br (x)) definido por

B(x, r) = {y ∈ Rn : kx − yk < r}.

Se a norma em questão for a norma euclideana as bolas serão “redondas”, caso contrário poderão
ter formatos mais ou menos inesperados, como se pode ver no exercı́cio seguinte.

Exercı́cio 2.1.3 Esboce as bolas B1 (0) em R2 para as seguintes normas:


p
1. k(x, y)k = x2 + y 2
2. k(x, y)k = |x| + |y|
3. k(x, y)k = máx{|x|, |y|}

Exercı́cio 2.1.4 Mostre que uma bola será sempre um conjunto convexo, isto é, dados dois quais-
quer dos seus pontos, o segmento de recta que os une está contido na bola.
Daqui para a frente vamos sempre supor que a norma em Rn é a norma euclideana, a não ser
que seja dito algo em contrário. Além disso a notação não distinguirá as normas euclidianas em
diferentes espaços Rn para n ≥ 2.

Definição 2.1.3 Diz-se que um conjunto A ⊂ Rn é aberto se verificar a seguinte propriedade:

∀x ∈ A, ∃r > 0 : B(x, r) ⊂ A.

Exemplo 2.1.1 O conjunto ]0, 1[ ⊂ R é aberto. Com efeito, para qualquer número real 0 < x < 1
temos x > 1/2 ou x ≤ 1/2. No primeiro caso B(x, x/2) ⊂ ]0, 1[, no segundo B(x, (1−x)/2) ⊂ ]0, 1[.

Exercı́cio 2.1.5 Mostre que as bolas abertas são conjuntos abertos.

24 de Janeiro de 2000 8
2.1. PRELIMINARES

Temos reunidos todos os ingredientes ncessários à definição de função contı́nua:

Definição 2.1.4 Diz-se que uma função f : A ⊂ Rn → Rm é contı́nua num ponto x ∈ A se:

∀ > 0 ∃δ > 0 tal que kx − yk < δ, y ∈ A ⇒ kf (x) − f (y)k < .

Diz-se que f é contı́nua num subconjunto do seu domı́nio se for contı́nua em todos os pontos desse
conjunto.

Exemplo 2.1.2 Suponhamos f (x, y) = x + y. Provemos que f é contı́nua. Seja  > 0 arbitrário.
Reparemos que, para todo o (x1 , y1 ) e (x2 , y2 ), se tem

|x1 + y1 − x2 − y2 | ≤ |x1 − x2 | + |y1 − y2 |,

sendo que |x1 − x2 | ≤ k(x1 , y1 ) − (x2 , y2 )k e |y1 − y2 | ≤ k(x1 , y1 ) − (x2 , y2 )k. Portanto, fixando
 > 0, e escolhendo δ < 2 teremos:

|x1 + y1 − x2 − y2 | ≤ 2δ < ,

se k(x1 , y1 ) − (x2 , y2 )k < δ. Logo f é contı́nua.

Exercı́cio 2.1.6 Mostre que a função definida por


(
1, se x + y > 0,
f (x, y) =
0, se x + y ≤ 0

não é contı́nua.
Muitas vezes, para mostrar continuidade (ou a falta dela), utiliza-se a caracterização de conti-
nuidade através de sucessões:
Teorema 2.1.1 (Continuidade à Heine)
Seja f : A ⊂ Rn → Rm . f é contı́nua em x0 ∈ A se e somente se para toda a sucessão (xk )k∈N ⊂ A
que converge para x0 (isto é, limk→+∞ kxk − x0 k = 0) a sucessão (f (xk ))k∈N converge para f (x0 ).

Exemplo 2.1.3 Seja f : Rn → Rm , g : Rm → Rp , f e g contı́nuas. Provemos que g ◦ f é


contı́nua. Seja x0 ∈ Rn e (xk ) ⊂ Rn uma sucessão convergente para x0 . Definindo yk = f (xk )
obtemos uma sucessão (yk ) ⊂ Rm que converge para y0 = f (x0 ), uma vez que f é contı́nua. A
sucessão (zk ) ⊂ Rp , definida por zk = g(yk ), converge para z0 = g(y0 ), uma vez que g é contı́nua.
Resta observar que zk = g ◦ f (xk ) → z0 = g ◦ f (x0 ), pelo que g ◦ f é contı́nua.

Exercı́cio 2.1.7 Refaça o exemplo anterior usando a definição 2.1.4.

Exercı́cio 2.1.8 Prove o teorema 2.1.1.

Exercı́cio 2.1.9 Seja f : Rn → Rm . Prove que f é contı́nua se e somente se para todo o aberto
A ⊂ Rm se tem f −1 (A) ⊂ Rn aberto, onde o conjunto f −1 (A) é definido como sendo:

f −1 (A) = {x ∈ Rn : f (x) ∈ A}.

Generalize este resultado para funções definidas num subconjunto arbitrário de Rn .

Definição 2.1.5 Diz-se que um conjunto F ⊂ Rn é fechado se o seu complementar F c for aberto.

Teorema 2.1.2 (Caracterização dos fechados via sucessões)


F ⊂ Rn é fechado se e só se dada uma qualquer sucessão convergente de termos em F esta converge
para um elemento de F .

9 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Exercı́cio 2.1.10 Dê dois exemplos distintos de subconjuntos de Rn que sejam, cada um deles,
simultaneamente aberto e fechado (isto só se verifica para dois conjuntos muito especiais!).

Definição 2.1.6 A união de todos os abertos contidos num conjunto A será designada por interior
de A e abrevia-se int A. À intersecção de todos os fechados contendo A chamar-se-á fecho de A e
abrevia-se A. A fronteira de A, ∂A, é definida por ∂A = A \ int A.

Definição 2.1.7 Diz-se que um conjunto K ⊂ Rn é compacto se dada uma qualquer sucessão de
termos em K esta possui uma subsucessão convergente para um elemento de K.

Teorema 2.1.3 (Caracterização dos compactos de Rn )


K ⊂ Rn é compacto se e só se K é limitado e fechado.

Exercı́cio 2.1.11 O conjunto vazio é compacto? E o conjunto dos números racionais de valor
absoluto menor que 1?

Exercı́cio 2.1.12 Dê um exemplo de uma função f : Rn → R tal que


1. {x ∈ Rn : f (x) ≤ 1} seja um conjunto compacto.
2. {x ∈ Rn : f (x) < 1} seja um conjunto compacto não vazio. Observação: se f for contı́nua
então este conjunto é necessariamente aberto (porquê?) portanto se escolher f contı́nua o
conjunto será necessariamente vazio (porquê?).
3. Seja K um conjunto compacto. Construa uma função f tal que K = {x : f (x) = 1}.
Escolhendo f não contı́nua o problema é trivial. No entanto pode tornar o problema bem
mais interessante tentando construir f contı́nua!

2.1.1 Exercı́cios suplementares


Exercı́cio 2.1.13 Diz-se que duas normas em Rn , k · kα e k · kβ , são equivalentes se existirem
constantes positivas, a e b tais que

akxkα ≤ kxkβ ≤ bkxkα

para todo o x ∈ Rn . Prove que as seguintes normas são todas equivalentes entre si:
1. k(x1 , . . . , xn )k1 = |x1 | + . . . + |xn |
p
2. k(x1 , . . . , xn )k2 = |x1 |2 + . . . + |xn |2
3. k(x1 , . . . , xn )k∞ = máx{|x1 |, . . . , |xn |}

Exercı́cio 2.1.14 Prove que as seguintes funções são contı́nuas:


1. f (x) = 1 se −∞ < x ≤ 1 e f (x) = x se x ≥ 1;
2. qualquer polinómio em n variáveis.

Exercı́cio 2.1.15 Prove que (


0, se x < 0,
f (x) =
1, se x ≥ 0,
não é contı́nua.

Exercı́cio 2.1.16 Diz-se que uma função f : J ⊂ Rn → R é semicontı́nua inferior se para toda
a sucessão xk → x ∈ J se tem lim inf j→+∞ f (xk ) ≥ f (x) (recorde que o lim inf de uma sucessão
(yk )k∈N é definido como sendo lim inf k→+∞ yk = limn→+∞ inf k>n {yk }).

24 de Janeiro de 2000 10
2.1. PRELIMINARES

1. Mostre que o lim inf existe sempre (eventualmente pode ser igual a −∞, quando?).
2. Mostre que qualquer função contı́nua é semicontı́nua inferior.
3. Dê um exemplo de uma função semicontı́nua inferior que não seja contı́nua.
4. Mostre que qualquer função semicontı́nua inferior f definida num compacto K é limitada
inferiormente, isto é ∃C ∈ R tal que f (x) ≥ C sempre que x ∈ K.
5. Mostre que uma função semicontı́nua inferior definida num compacto tem sempre mı́nimo.
6. Utilizando as ideias das alı́neas anteriores mostre que qualquer função contı́nua definida num
compacto tem máximo e mı́nimo.

Exercı́cio 2.1.17 As definições de aberto e função contı́nua dependem aparentemente de usarmos


a norma euclidiana. Uma dúvida legı́tima é saber se tivessemos usado outra norma chegarı́amos às
mesmas conclusões relativamente a que conjuntos são abertos e que funções são contı́nuas. Mostre
que:
1. Todas as normas em Rn são contı́nuas.
2. Qualquer norma em Rn tem um mı́nimo positivo na fronteira da bola B(0, 1).
3. Todas as normas em Rn são equivalentes.
4. Conclua que as noções de aberto e função contı́nua são independentes da norma utilizada.

2.1.2 Sugestões para os exercı́cios


2.1.13 Observe que ∀x ∈ Rn
1. kxk∞ ≤ kxk1 ≤ nkxk∞ ;

2. kxk∞ ≤ kxk2 ≤ nkxk∞ .
Usando 1 e 2 deduza as restantes desigualdades. J
2.1.14 Utilize a definição 2.1.4 e o teorema 2.1.1. J
2.1.15 Note que f − n1 → 0 6= f (0).

J
2.1.16
1. Note que a sucessão zn = inf k>n {yk } é monótona crescente.
2. Se f é contı́nua e xk → x então f (xk ) → f (x).
3. Por exemplo (
0 se x ≤ 0,
f (x) =
1 se x > 0.

4. Se f não fosse limitada inferiormente existiria uma sucessão xk ∈ K tal que f (xk ) →
−∞. Como K é compacto poder-se-ia extrair uma subsucessão convergente xkj → x ∈
K. Consequentemente ter-se-ia −∞ = lim f (xkj ) = lim inf f (xkj ) ≥ f (x) > −∞ o que é
absurdo.
5. Seja f : K → R, onde K ⊂ Rn é compacto, semicontı́nua inferior. Note que, pela alı́nea
anterior, f é minorada. Defina-se m = inf y∈K f (y). Então existe uma sucessão xk ∈ K tal
que f (xk ) → m. Como K é compacto, existe uma subsucessão xkj que converge para algum
x ∈ K. Por semicontinuidade inferior tem-se
m = lim f (xkj ) = lim inf f (xkj ) ≥ f (x)
j→+∞ j→+∞

mas por outro lado f (x) ≥ inf y∈K f (y) = m portanto f (x) = m.

11 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

y = f(x)

b y = b + f'(a)(x-a)

a x

Figura 2.1: A interpretação geométrica de derivada para funções reais de variável real.

6. Se f é contı́nua então f e −f são semicontı́nuas inferiores.


J

2.2 Cálculo diferencial elementar


Vamos começar por definir função diferenciável .

Definição 2.2.1 Seja U ⊂ Rn um aberto. Diz-se que uma função f : U → Rm é diferenciável no


ponto x0 ∈ U se existir uma aplicação linear A de Rn em Rm , para a qual se tem
kf (x0 + h) − f (x0 ) − Ahk
lim = 0.
h→0,h∈Rn khk
Será à aplicação linear A na definição anterior que chamaremos derivada3 de f no ponto x0 .
No entanto poderia existir mais do que uma aplicação linear nestas condições. . .

Problema 2.2.1 Mostre que a aplicação linear A da definição 2.2.1 se existir é única.

Definição 2.2.2 A aplicação linear A da definição 2.2.1 designa-se por derivada de f em x0


escrevendo-se Df (x0 ).
Esta definição de derivada coincide com a definição usual de derivada para funções reais de
variável real. Para este caso, a aplicação linear A referida na definição anterior é simplesmente
multiplicação por um escalar.

Exercı́cio 2.2.1 Suponha f : U ⊂ Rn → Rm é diferenciável num ponto x0 ∈ int U . Prove que

f (x0 + h) = f (h0 ) + Df (x0 )(h) + o(h),

onde limh→0,h∈Rm o(h)


khk = 0.

Definição 2.2.3 Diz-se que uma função f : U ⊂ Rn → Rm . Se U for aberto dizemos que f é
diferenciável em U se o for em todos os pontos do domı́nio U . Se U não for aberto dizemos que
f é diferenciável em U se existir um prolongamento f de f a um aberto V contendo U tal que f
seja diferenciável em V .
3 Tal aplicação será muitas vezes identificada com a matriz real m × n que a representa ou com um vector se n

ou m for igual a 1. Se n = 1 é comum usar f 0 (x0 ) em vez de Df (x0 ).

24 de Janeiro de 2000 12
2.2. CÁLCULO DIFERENCIAL ELEMENTAR

Exemplo 2.2.1 Seja f definida em R por f (x) = x3 . Mostremos que ela é diferenciável em
qualquer ponto de x ∈ R e que a sua derivada é 3x2 .
Com efeito temos

|(x + h)3 − x3 − 3x2 h| |3xh2 + h3 |


lim = lim = 0.
h→0 |h| h→0 |h|

A verificação da diferenciabilidade usando directamente a definição pode ser, mesmo em casos


simples, penosa. Isso não acontece, no entanto, no caso ilustrado no próximo exercı́cio.

Exercı́cio 2.2.2 Mostre que uma transformação linear f : Rm → Rn , dada por f (x) = M x, onde
M é uma matriz n × m, é diferenciável e que Df = M .

As funções diferenciáveis formam um subconjunto estrito das funções contı́nuas. Com efeito:

Exercı́cio 2.2.3 Mostre que qualquer função diferenciável é contı́nua.

Consideremos uma função f : U ⊂ Rn → Rm e fixemos um vector v ∈ Rn . Dado um ponto


x0 ∈ U , podemos restringir a função f à recta que passa por x0 e com sentido definido por v. A
derivada “ao longo” desta recta chama-se derivada dirigida:

Definição 2.2.4 Define-se a derivada dirigida da função f : U ⊂ Rn → Rm no ponto x0 ∈ U ,


segundo o vector v ∈ Rn como sendo

f (x0 + λv) − f (x0 )


Dv f (x0 ) = lim .
λ→0 λ
se o limite existir.

Este uma relação simples entre derivadas dirigidas relativamente a vectores com a mesma
direcção (qual?). Daı́ “normalizarmos” as derivadas dirigidas considerando muitas vezes v como
sendo unitário. Nesse caso designamos a derivada dirigida como derivada direccional .
A definição de derivada dirigida é mais fraca do que a definição de função diferenciável. Com
efeito há funções que não são diferenciáveis num determinado ponto mas que admitem derivadas
dirigidas. Pode mesmo acontecer que uma função admita algumas (ou todas!) as derivadas
dirigidas num determinado ponto mas que não seja sequer contı́nua nesse ponto.

Exemplo 2.2.2 Consideremos a função definida por


(
1, se x ∈
/ Q,
f (x, y) =
0, se x ∈ Q.

Claramente esta função não é contı́nua. No entanto, ela admite derivada dirigida na direcção
(0, 1). Fixemos um ponto (x0 , y0 ). Se x0 for racional teremos f (x0 , y0 + h) = 0, para qualquer
h ∈ R. Deste modo
D(0,1) f (x0 , y0 ) = 0.
Analogamente se x0 for irracional teremos f (x0 , y0 + h) = 1, para todo o h ∈ R. Pelo que também
se terá
D(0,1) f (x0 , y0 ) = 0.

As derivadas direccionais de funções f : U ⊂ Rn → R na direcção dos eixos coordenados e no


sentido crescente da coordenada são frequentemente utilizadas e por isso têm um nome especial:
derivadas parciais.

13 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Definição 2.2.5 Seja f : U ⊂ Rn → R. A derivada parcial de f em relação a xi é definida, caso


o limite exista, por
∂f f (x + λei ) − f (x)
(x) = Dei f (x) = lim ,
∂xi h→0 λ
com x = (x1 , . . . , xn ) e sendo ei o versor da direcção i. Por vezes usaremos a notação Di f em
∂f
vez de ∂xi
.

Analisando a definição facilmente se conclui que, em termos práticos, a derivada parcial de f


em ordem a xi é calculada coordenada a coordenada se m > 1, o que permite lidar só com funções
escalares, e, para cada uma destas, fixando todas as variáveis excepto xi e derivando cada fj em
ordem a xi como se esta fosse uma função real de variável real.

Exemplo 2.2.3 Seja g(x, y) = (x2 y 2 , x). As derivadas parciais de g em ordem a x e y são

∂g ∂g
= (2xy 2 , 1) = (2x2 y, 0).
∂x ∂y

Exercı́cio 2.2.4 Calcule a derivada parcial em ordem a y das seguintes funções

1. f (x, y, z) = xyz;

2. f (x, y) = x2 + sen(xy);

3. f (x, y, z, w) = 0.

Se uma função é diferenciável as derivadas parciais permitem construir facilmente a matriz


representando a derivada.

Proposição 2.2.1
Se uma função f : U ⊂ Rn → Rm é diferenciável em a então a derivada Df (a) satisfaz Df (a)(h) =
Jf (a)h em que é a matriz jacobiana de f no ponto a definida por
 ∂f1 ∂f1 
∂x1 (a) ... ∂xm (a)
Jf (a) =  .. ..
.
 
. .
∂fn ∂fn
∂x1 (a) . . . ∂xm (a)

A diferenciabilidade de uma função pode ser estabelecida facilmente à custa da continuidade


das derivadas parciais:

Definição 2.2.6 Diz-se que uma função f : U ⊂ Rn → Rm com U aberto é de classe C 1 (U ) se


existirem as derivadas parciais

∂fj
, 1 ≤ j ≤ m, 1 ≤ i ≤ n
∂xi

e forem contı́nuas. Se U não fôr aberto dizemos que f ∈ C 1 (U ) se existir um aberto V ⊃ U e uma
função g : V → Rm tal que g|U = f e g ∈ C 1 (V ).

Exemplo 2.2.4 A função f (x, y) = x2 y 2 é de classe C 1 pois as suas derivadas parciais são
contı́nuas (veja exemplo 2.2.3).

Exemplo 2.2.5 Calculemos a derivada da função

f (x, y, z, w) = (f1 , f2 , f3 ) = (x + y, x + y + z 2 , w + z).

24 de Janeiro de 2000 14
2.2. CÁLCULO DIFERENCIAL ELEMENTAR

Aplicando os resultados e observações anteriores temos


 ∂f ∂f1 ∂f1 ∂f1
 
1 
∂x ∂y ∂z ∂w 1 1 0 0
Jf =  ∂f
 2 ∂f2 ∂f2 ∂f2  
∂x ∂y ∂z ∂w  = 1 1 2z 0
∂f3 ∂f3 ∂f3 ∂f3 0 0 1 1
∂x ∂y ∂z ∂w

pelo que a função é C 1 , logo diferenciável e a derivada é representada pela matriz Jf .

Proposição 2.2.2 (C 1 implica diferenciabilidade)


Uma função f : U ⊂ Rn → Rm de classe C 1 (U ) com U aberto é diferenciável em U .

Ideia da demonstração. Claro que basta supor m = 1. Além disso consideramos n = 2 pois tal
permite usar notação mais simples e quando terminarmos será óbvio como generalizar para n > 2.
Seja (x, y) ∈ U . Basta provar que

f (x + h, y + k) − f (x, y) − h ∂f ∂f
∂x (x, y) − k ∂y (x, y)
lim 1/2
= 0.
(h,k)→(0,0) (h2 + k 2 )

Para tal decompomos a diferença f (x+h, y +k)−f (x, y) como uma soma de parcelas de diferenças
de valores de f em que em cada parcela os argumentos de f só diferem numa coordenada. Uma
escolha possı́vel é

f (x + h, y + k) − f (x, y) = [f (x + h, y + k) − f (x, y + k)] + [f (x, y + k) − f (x, y)].

Podemos assim lidar separadamente com cada coordenada reduzindo o nosso objectivo a provar

f (x + h, y + k) − f (x, y + k) − h ∂f
∂x (x, y)
lim 1/2
= 0, (2.1)
(h,k)→(0,0) (h2 + k 2 )
f (x, y + k) − f (x, y) − k ∂f
∂y (x, y)
lim 1/2
= 0. (2.2)
(h,k)→(0,0) (h2 + k 2 )

Para lidar com (2.1) use o teorema de Lagrange, aplicado a g(t) = f (x + t, y + k) − f (x, y + k),
para obter que existe θ, 0 < θ < 1, tal que f (x + h, y + k) − f (x, y + k) = h ∂f
∂x (x + θh, y + k) e
use a continuidade da derivada parcial. Para lidar com (2.2) pode usar um raciocı́nio análogo ou
simplesmente a definição de derivada parcial.

Problema 2.2.2 Verifique que a demonstração da proposição 2.2.2 permite enunciar o resultado
sob hipóteses mais gerais. Dê um exemplo de uma função que satisfaça tais hipóteses e não seja
C 1 . Altere a demonstração para obter o caso n > 2.

Exercı́cio 2.2.5 Mostre que são diferenciáveis e calcule a derivada das seguintes funções:

1. f (x, y, z) = (x2 − y 2 , xy)

2. f (x, y) = (x − y, x + y, 2x + 3y)

3. f (x, y) = (sen(x + y), cos(x − y))

4. f (x, y) = (ex+y+z , log(1 + ey ), z 2 + x)

No caso de funções escalares (m = 1) a derivada é representada por uma matriz linha que
se identifica a um vector de Rn que merece um nome especial pela sua importância no cálculo
diferencial e nas aplicações.

15 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Definição 2.2.7 Suponha que uma função f : U ⊂ Rn → R possui todas as derivadas parciais
num ponto a ∈ U . Define-se o gradiente de f em a, ∇f (a), via
 
∂f ∂f
∇f (a) = (a), . . . , (a) .
∂x1 ∂xn

Exercı́cio 2.2.6 Verifique que se f : U ⊂ Rn → R é diferenciável em a ∈ U então:

1. Df (a)(h) = Dh f (a) = ∇f (a) · h;

2. supkhk=1 Dh f (a) = k∇f (a)k.

Exercı́cio 2.2.7 Mostre que a derivada da composição f ◦ g das transformações lineares f (y) =
Ay, g(x) = Bx, onde f : Rn → Rm , g : Rp → Rn e A, B são matrizes reais m × n e n × p,
respectivamente, é a matriz AB.

O próximo teorema fornece um método de cálculo da derivada de funções obtidas por com-
posição. Note que para aplicações lineares a demonstração é trivial (exercı́cio 2.2.7) e sugere o
resultado geral: a derivada da composta é a composta das derivadas. Mais precisamente:

Teorema 2.2.3 (Derivação da Função Composta ou Regra da Cadeia)


Sejam f : V ⊂ Rn → Rm e g : U ⊂ Rp → Rn , funções diferenciáveis, a ∈ U, f (a) ∈ V com U e V
abertos. Então f ◦ g : U ∩ f −1 (V ) → Rm é diferenciável em a e verifica-se:

D(f ◦ g)(a) = Df (g(a)) ◦ Dg(a).

Se f e g forem de classe C 1 então h é de classe C 1 .

De um ponto de vista de cálculo as derivadas parciais da composta são calculáveis em termos das
derivadas parciais das funções que definem a composição usando o resultado anterior e o facto de à
composição de aplicações lineares corresponder o produto de matrizes que as representam. Assim
é importante compreender exemplos cujo protótipo mais simples é do tipo seguinte:

Exemplo 2.2.6 Seja f : R2 → R e g = (g1 , g2 ) : R → R2 . Se f e g forem diferenciáveis então

d(f ◦ g) ∂f dg1 ∂f dg2


(t) = (g1 (t), g2 (t)) (t) + (g1 (t), g2 (t)) (t).
dt ∂x1 dt ∂x1 dt
Um outro exemplo do mesmo género é:

Exemplo 2.2.7 Seja f (x, y) = (x + y, x − y) e g(t1 , t2 , t3 ) = (t1 + 2t2 , t2 + 2t3 ). f e g são


diferenciáveis. A derivada de f ◦ g é

D(f ◦ g)(t1 , t2 , t3 ) =Df (g(t1 , t2 , t3 ))Dg(t1 , t2 , t3 ) =


    
1 1 1 2 0 1 3 2
= = .
1 −1 0 1 2 1 1 −2

Quando não há risco de confusão sobre os pontos em que se calculam as diversas derivadas
parciais é comum abreviar uma fórmula como a do exemplo 2.2.6 como segue:
d ∂f dg1 ∂f dg2
(f ◦ g) = +
dt ∂x1 dt ∂x2 dt
ou
d ∂f dx1 ∂f dx2
(f ◦ g) = + .
dt ∂x1 dt ∂x2 dt
Há risco de confusão em situações como a seguinte:

24 de Janeiro de 2000 16
2.2. CÁLCULO DIFERENCIAL ELEMENTAR

Exercı́cio 2.2.8 Suponha que f : R2 → R é diferenciável, f (0, 1) = 0 e f (1, 0) = 0. Seja


g(x, y) = f (f (x, y), f (y, x)). Calcule
∂g
(0, 1)
∂x
em termos de derivadas parciais de f em pontos convenientes. Convir-lhe-á usar a notação Di f
para evitar ambiguidades.

Exercı́cio 2.2.9 Calcule a derivada da composição h = f ◦ g nos seguintes casos:


1. f (x, y, z) = x2 + y 2 + z 2 e g(t) = (t, 2t, 3t)
2. f (x, y) = (xy 5 + y ch y 2 , x tg(sh x2 ) + 3y, x − y) e g(t) = (3, 4).

Exercı́cio 2.2.10 Seja f : U ⊂ Rn → R e g : [a, b] → U diferenciáveis tais que f é constante no


contradomı́nio de g. Mostre que ∇f (g(t)) · g 0 (t) = 0 para todo o t ∈ [a, b]. Interprete este resultado
como significando que, para funções diferenciáveis, o gradiente é ortogonal aos conjuntos de nı́vel
da função.
O teorema de derivação da função composta permite generalizar alguns resultados com facili-
dade à custa de resultados já conhecidos para funções reais de variável real. Por exemplo o teorema
de Lagrange para funções escalares em que se relaciona a diferença entre os valores de uma função
em dois pontos e a derivada no segmento de recta4 que os une.

Teorema 2.2.4 (do valor médio ou de Lagrange)


Sejam U ⊂ Rn um aberto e f : U → R uma função diferenciável. Se x, y ∈ U e L(x, y) ⊂ U então
existe θ ∈ ]0, 1[ tal que

f (y) − f (x) = ∇f (x + θ(y − x)) · (y − x).

Exercı́cio 2.2.11 Prove o teorema do valor médio. Sugestão: considere a função de variável real
g(t) = f (x + t(y − x)) e aplique o teorema do valor médio para funções a uma variável.

2.2.1 Exercı́cios suplementares


Exercı́cio 2.2.12 Seja f : R2 → R definida por
xy 2
(
x2 +y 4 , se (x, y) 6= (0, 0)
f (x, y) =
0, se (x, y) = (0, 0).

a) Determine justificadamente o maior subconjunto do domı́nio de f em que esta função é


contı́nua.
b) Uma função H : R2 → R2 verifica H(0, 1) = (1, −1) é diferenciável em (0, 1) sendo a matriz
jacobiana de H nesse ponto dada por
 
1 −1
JH (0, 1) = .
1 2

Calcule a derivada dirigida D(1,1) (f ◦ H)(0, 1).

*Exercı́cio 2.2.13 Se f : R2 → R está definida por


( 3 3
x −y
2 2, se (x, y) 6= (0, 0)
f (x, y) = x +y
0, se (x, y) = (0, 0).
4 Dados x, y ∈ Rn define-se o segmento de recta unindo x a y como sendo o conjunto L(x, y) = {z = x+t(y−x) :

t ∈ [0, 1]}.

17 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

a) Calcule o valor máximo de Dh f (1, 2) quando h é um vector unitário.


b) Calcule a equação do plano tangente ao gráfico de f no ponto (x, y, z) = (1, 2, −7/5).
*c) Decida justificadamente se o gráfico de f constitui ou não uma variedade diferenciável. Se
optar pela negativa determine o maior subconjunto do gráfico de f que efectivamente constitui
uma variedade diferenciável. Em qualquer caso determine justificadamente a dimensão da
variedade e o espaço normal no ponto (1, 2, −7/5).

Exercı́cio 2.2.14 Calcule as derivadas parciais de primeira ordem de


1. f (x, y, z) = x2 + y 2 + z 2
2. f (x, y) = sen(sen(sen(sen(x + y))))
R x+y −s2
3. f (x, y) = 0 e ds

∂f
Exercı́cio 2.2.15 Seja f (x, y) = y sen(x2 + arctg(y − cos(x))) + 2. Calcule ∂x (0, 0).

Exercı́cio 2.2.16 Moste que as seguintes funções são diferenciáveis e calcule as suas derivadas:
1. f (x, y) = (x2 + y, x − y)
Ry Rx
2. f (x, y) = (x 0 ecos(s) ds, y 0 ecos(s) ds)

Exercı́cio 2.2.17 Calcule a derivada de f ◦ g nos seguintes casos:


1. f (x, y, z) = x2 + y 2 + z 2 e g(t) = (sen(t), cos(t), 0);
2. f (x, y) = (x + y, x − y) e g(u, v) = (v, u);
2
+y 2 )
3. f (x, y, z, w) = cos(e(x − z − w) e g(p, q) = (0, 1, 2, 3).

2.2.2 Sugestões para os exercı́cios

2.2.14
∂f
a) ∂x = 2x, ∂f ∂f
∂y = 2y e ∂z = 2z. Observe que o vector (2x, 2y, 2z) é ortogonal à fronteira
das bolas centradas em 0, isto é às esferas de equação da forma x2 + y 2 + z 2 = c. Isto não
é uma coincidência mas sim uma consequência do que foi aflorado no exercı́cio 2.2.10 e que
retomaremos!
∂f ∂f
b) ∂x = ∂y = cos(sen(sen(sen(x + y)))) cos(sen(sen(x + y))) cos(sen(x + y)) cos(x + y);
∂f ∂f 2
c) ∂x = ∂y = e−(x+y) (observe que não é necessário calcular o integral).
J
2.2.15 Observe que f (x, 0) = 2. J
2.2.16 Ambas as funções são de classe C 1 , pois as derivadas parciais são contı́nuas. Portanto:
 
2x 1
1. Df = .
1 −1
R y cos(s)
ds R xecos(y)

e
2. Df = 0 cos(x) x cos(s)
ye 0
e ds
J
2.2.17

24 de Janeiro de 2000 18
2.3. DERIVADAS PARCIAIS DE ORDEM SUPERIOR À PRIMEIRA

1. Observe que (f ◦ g)(t) = 1 para qualquer t.

2. Pela regra da cadeia temos:


    
1 1 0 1 1 −1
D(f ◦ g) = Df Dg = = .
1 −1 1 0 1 1

3. Note que Dg = 0 pelo que D(f ◦ g) = 0.

2.3 Derivadas parciais de ordem superior à primeira


Vamos considerar com derivadas parciais de ordem superior à primeira que, no essencial, se definem
recursivamente.

Definição 2.3.1 Seja f : Rn → R. As derivadas parciais de segunda ordem, com respeito a xi e


xj , 1 ≤ i, j ≤ n, são definidas por
∂2f ∂ ∂f
= ,
∂xi ∂xj ∂xi ∂xj
∂2f ∂2f
caso a expressão da direita esteja definida. Se i = j escreve-se ∂xi ∂xi = ∂x2i
. Procede-se de modo
análogo para derivadas parciais de ordem superior à segunda.

Exemplo 2.3.1 Uma notação como


∂4u
∂x∂y 2 ∂z
indica que a função u foi derivada sucessivamente em ordem à variável z, duas vezes em ordem a
y e finalmente em ordem a x.

Exemplo 2.3.2 Seja f (x, y) = x2 + 2y 2 + xy. Temos

∂2f
 
∂ ∂f ∂
= = (4y + x) = 1.
∂x∂y ∂x ∂y ∂x

Exemplo 2.3.3 Seja f (x, y, z) = sen(x + y + z)

∂5f ∂4 ∂3
= (cos(x + y + z)) = − (sen(x + y + z)) =
∂x2 ∂y∂z∂y ∂x2 ∂y∂z ∂x2 ∂y
∂2 ∂
= − 2 (cos(x + y + z)) = (sen(x + y + z)) = cos(x + y + z).
∂x ∂x

∂2f
Exercı́cio 2.3.1 Seja f (x, y) = x2 + 2y 2 + xy. Calcule ∂y∂x ; observe que o resultado é o mesmo
do exemplo 2.3.2.

O resultado deste último exercı́cio ser o mesmo do exemplo 2.3.2 não é uma coincidência mas
sim a consequência de um facto mais geral — o Teorema de Schwarz. Antes de o enunciarmos
precisamos de uma definição:

Definição 2.3.2 Considere uma função f : U ⊂ Rn → R.

• Se U for aberto diz-se que f é de classe C k em U , k ∈ N, ou abreviadamente f ∈ C k (U ), se


todas as derivadas parciais de ordem k de f existirem e forem contı́nuas em U .

19 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

y +k

x x +h x

Figura 2.2: Convenções na demonstração da Proposição 2.2.2 e do Teorema 2.3.1.

• Se U não for aberto escrevemos f ∈ C k (U ), k ∈ N, se existir V aberto com V ⊃ U e uma


função g ∈ C k (V ) tal que a restrição de g a U seja igual a f .

• f diz-se de classe C 0 (U ) se for contı́nua em U .

• Adicionalmente, para U aberto, definimos C ∞ (U ) = ∩k∈N C k (U ) e para um conjunto não


necessariamente aberto procedemos como anteriormente.

Na maior parte das aplicações do cálculo diferencial a hipótese de uma função ser de classe C k
para um certo k é natural. Certos resultados a citar a seguir serão válidos sob hipóteses mais gerais
mas abstermo-nos-emos de dar importância especial a tais hipóteses. Por vezes serão remetidas
para problemas.

Exercı́cio 2.3.2 Seja p(x1 , . . . xn ) um polinómio em n variáveis. Mostre que sen(p(x1 , . . . xn )) é


uma função C ∞ (Rn ).

Problema 2.3.1 Verifique que se j < k então C k ⊂ C j .

O próximo teorema é um resultado muito importante que permite reduzir o número de cálculos
necessários para determinar as derivadas parciais de ordem superior á primeira. Ele diz-nos que,
sob certas condições, a ordem pela qual se deriva uma função é irrelevante.

Teorema 2.3.1 (Schwarz)


∂2f ∂2f
Seja f : U ⊂ Rn → R, a um ponto interior a U , f ∈ C 2 (U ). Então ∂xi ∂xj (a) = ∂xj ∂xi (a) para
quaisquer ı́ndices 1 ≤ i, j ≤ n.

Ideia da demonstração. Basta considerar n = 2 e convencionamos a = (x, y). Notamos que

∂2f [f (x + h, y + k) − f (x + h, y)] − [f (x, y + k) − f (x, y)]


(x, y) = lim lim (2.3)
∂x∂y h→0 k→0 hk
∂2f [f (x + h, y + k) − f (x, y + k)] − [f (x + h, y) − f (x, y)]
(x, y) = lim lim (2.4)
∂y∂x k→0 h→0 hk

Designemos o numerador das fracções dos segundos membros de (2.3-2.4) por D(h, k). Aplicando
o teorema de Lagrange à função g(t) = f (x + t, y + k) − f (x + t, y) no intervalo [0, h] obtemos que

24 de Janeiro de 2000 20
2.3. DERIVADAS PARCIAIS DE ORDEM SUPERIOR À PRIMEIRA

existe θ1 , 0 < θ1 < 1, tal que


 
∂f ∂f
D(h, k) = h (x + θ1 h, y + k) − (x + θ1 h, y) .
∂x ∂x

Uma segunda aplicação do teorema de Lagrange permite obter que existe θ2 , 0 < θ2 < 1, tal que

∂2f
D(h, k) = hk (x + θ1 h, y + θ2 k).
∂y∂x

Substituição em (2.3) e justificação de que ambos os limites iterados igualam lim(h,k)→(0,0) D(h, k)
permitem obter a igualdade pretendida.

Problema 2.3.2 O último passo da demonstração da Proposição 2.3.1 merece alguns comentári-
os. Por um lado θ1 e θ2 são funções de h e k. Por outro a relação entre um limite e um limite
iterado é, em geral, mais complexa do que o leitor pode imaginar. Seja f : U ⊂ R2 → R e (x0 , y0 )
um ponto interior de U . Mostre que:

a) Pode existir lim(x,y)→(x0 ,y0 ) f (x, y) sem que exista limx→x0 limy→y0 f (x, y).

b) Se lim(x,y)→(x0 ,y0 ) f (x, y) e limx→x0 limy→y0 f (x, y) existirem então são iguais.

Problema 2.3.3 É óbvio da demonstração da Proposição 2.3.1 que a hipótese f ∈ C 2 pode ser
aligeirada. Isto pode ser feito de várias formas. Formule e demonstre pelo menos dois resultados
deste tipo com hipóteses “mı́nimas” não equivalentes.

Exemplo 2.3.4 Seja f = 2xy. f é de classe C 2 uma vez que é um polinómio, portanto temos a
seguinte igualdade
∂2f ∂2f
= =2
∂x∂y ∂y∂x

Exemplo 2.3.5 Se f é de classe C 3 têm-se as seguintes igualdades:

∂3f ∂3f ∂3f


= =
∂x2 ∂y ∂x∂y∂x ∂y∂x2
e
∂3f ∂3f ∂3f
2
= = .
∂y ∂x ∂y∂x∂y ∂x∂y 2

Exercı́cio 2.3.3 Calcule as derivadas de todas as ordens de f (x, y, z) = 2x3 z+xyz+x+z (observe
que só há um número finito de derivadas não nulas. Porquê?).

O conceito de derivada dirigida de ordem superior à primeira permite formalizar o enunciado da


fórmula de Taylor de uma forma análoga ao resultado já conhecido para funções reais de variável
real.

Definição 2.3.3 Seja f : U ⊂ Rn → R. As derivadas dirigidas de ordem superior à primeira de


(1)
f num ponto x ∈ U segundo h definem-se recursivamente, se existirem, por Dh f (x) = Dh f (x)
e
(j) (j−1)
Dh f (x) = Dh (Dh f (x)), se j > 1.

Relembra-se que para funções diferenciáveis, e em particular de classe C 1 , temos Dh f (x) =


h · ∇f (x).

21 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Problema 2.3.4 Verifique que para funções de classe C j num aberto o cálculo da derivada diri-
(j) j
gida Dh f corresponde a aplicar à função f o operador diferencial (h · ∇) e consequentemente
(j)
Dh f é um polinómio homogéneo5 de grau j nas componentes do vector h. Se h = (h1 , h2 )
verifique que para n = 2 e j = 2 temos

(2) ∂2f ∂2f ∂2f


Dh f = h21 2 + 2h1 h2 + h22 2 .
∂x1 ∂x1 ∂x2 ∂x2

Em geral obtenha
n n
(j)
X X ∂j f
Dh f = ··· hi1 . . . h ij .
i1 =1 ij =1
∂xi1 . . . ∂xij

Note que existem termos “repetidos” na fórmula anterior. Calcular o número de repetições é
um problema de cálculo combinatório cuja solução no caso n = 2 é bem conhecida.

2.3.1 Exercı́cios suplementares


Exercı́cio 2.3.4 Seja f : R2 → R definida por:
(
xy, se |y| > |x|,
f (x, y) =
0, caso contrário.

Mostre que:
∂2f ∂2f
(0, 0) = 0 (0, 0) = 1.
∂x∂y ∂y∂x
Explique porque é que isto não contradiz o teorema 2.3.1.

Exercı́cio 2.3.5 Seja f : R2 → R uma função limitada (não necessariamente contı́nua). Mostre
que
g(x, y) = x + y + (x2 + y 2 )f (x, y)
é diferenciável na origem. Calcule a sua derivada. Dê um exemplo de uma função f tal que g não
seja contı́nua no complementar da origem.

Exercı́cio 2.3.6 Suponha f : Rn → Rn , f bijectiva, diferenciável e f −1 também diferenciável.


−1
Mostre que Df −1 (f (x)) = [Df (x)] . Use esta observação para, por exemplo, rededuzir a fórmula
da derivada de arcsen.

2.3.2 Sugestões para os exercı́cios

2.3.4 O teorema 2.3.1 só se aplicaria se a função f fosse de classe C 2 . J


2.3.5 Use a definição de derivada para mostrar que g é diferenciável com derivada representada
por ∇g(0, 0) = (1, 1). Para a segunda parte um exemplo possı́vel é
(
1, se x ∈ Q,
f (x, y) =
0, caso contrário.

J
−1 d 1
2.3.6 Observe que f (f (x)) = x. Diferencie esta expressão. dy (arcsen y) =√ . J
1−y 2

5 Um polinómio P de grau k diz-se homogéneo se P (λx) = λk P (x) para todo o λ ∈ R.

24 de Janeiro de 2000 22
2.4. POLINÓMIO DE TAYLOR

2.4 Polinómio de Taylor


Tal como no caso de funções reais de variável real podemos construir aproximações polinomiais de
funções de classe C k .

Teorema 2.4.1 (Taylor)


Seja f : U ⊂ Rn → R uma função de classe C k (U ) com U um aberto e x0 ∈ U . Para cada j ≤ k
existe um polinómio em n variáveis de grau j, único, Pj : Rn → R tal que

f (x) − Pj (x)
lim j
= 0. (2.5)
x→x0 |x − x0 |

O polinómio Pj é designado por polinómio de Taylor de ordem j de f relativo ao ponto x0 e é


dado por
j
X 1 (l)
Pj (x) = f (x0 ) + D f (x0 ). (2.6)
l! x−x0
l=1

O erro Ej (x) da fórmula de Taylor é dado por

Ej (x) = f (x) − Pj (x).

Ideia da demonstração. Decorre do resultado já conhecido para n = 1 e do teorema de derivação


da função composta por consideração da função auxiliar g : [0, 1] → R definida por g(t) = f (t(x −
x0 ) + x0 ) em que x ∈ Br (x0 ) ⊂ U .

Problema 2.4.1 Use o problema 2.3.4 para obter a fórmula de Taylor na forma:
k
X X 1 ∂pf
f (x) = i1 in
(x0 ) (x1 − x01 )i1 . . . (xn − x0n )in + Ek (x − x0 ). (2.7)
p=0 i1 +...+in =p
p! ∂y 1 . . . ∂yn

O leitor é aconselhado a pensar no polinómio de Taylor via a propriedade (2.5) e não simples-
mente como um polinómio calculável via (2.6) ou (2.7).

Problema 2.4.2 Formule o Teorema de Taylor explicitando o resto da fórmula de Taylor numa
forma análoga a uma das conhecidas para funções reais de variável real.

Poderá pensar-se que o cálculo do polinómio de Taylor para funções de várias variáveis e
para uma ordem relativamente elevada é um pesadelo computacional. Nem sempre será assim se
tirarmos partido, quando possı́vel, de resultados já conhecidos para funções de uma variável.
Frequentemente em vez de escrevermos o termo de erro Ek (x − y), escrevemos o(kx − ykk ),
com o mesmo significado.

Exemplo 2.4.1 Se f (x, y) = xy + sen x, a fórmula de Taylor de segunda ordem em torno de


(π, 0) é:

1 ∂ 2 f

∂f ∂f
f (x, y) =f (π, 0) + (x − π) + y++ (x − π)2
∂x (π,0) ∂y (π,0) 2 ∂x2 (π,0)
∂ 2 f 1 ∂ 2 f

+ (x − π)y + y 2 + o(k(x − π, y)k2 ),
∂x∂y (π,0) 2 ∂y 2 (π,0)

ou seja
f (x, y) = π − x + xy + o(k(x − π, y)k2 ).

23 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

Exemplo 2.4.2 Se f (x, y) = x2 + 2xy + y 2 então a sua expansão em fórmula de Taylor até à
segunda ordem, em torno de qualquer ponto, é x2 +2xy+y 2 . Com efeito, f (x, y)−x2 +2xy+y 2 = 0
pelo que (2.8) vale. Repare que isto evitou termos de calcular 5 derivadas!

Exercı́cio 2.4.1 Calcule a fórmula de Taylor até à terceira ordem das seguintes funções:
1. f (x, y, z) = x + y 2 + z;
2. f (x, y, z) = 1 + x + y + z + xy + xz + yz + xyz;
3. f (x, y) = ex + xyz.

Exercı́cio 2.4.2 Mostre que a fórmula de Taylor de ordem k para um polinómio de grau k coincide
com o polinómio.

Exercı́cio 2.4.3 Demonstre a parte correspondente a unicidade do teorema de Taylor. [Suponha


que existe um polinómio p(x) para o qual (2.8) vale. Mostre que se existisse outro polinómio
q(x) 6= p(x), de grau menor ou igual ao grau de p obterı́amos uma contradição.]
Em certos casos podemos utilizar o conhecimento da expansão em potências de uma função
real de variável real para calcularmos a expansão em potências de expressões mais complicadas:

Exemplo 2.4.3 Queremos calcular a expansão de Taylor da função sen(x2 + y 4 ) até à ordem 6
em torno da origem. Sabemos que
t3
sen t = t − + o(|t|3 ).
6
Deste modo temos
(x2 + y 4 )3
sen(x2 + y 4 ) = x2 + y 4 − + o((x2 + y 4 )3 )
6
pelo que
x6
sen(x2 + y 4 ) = x2 + y 4 − + o(k(x, y)k6 ),
6
em que na última igualdade tivemos em atenção que (x2 + y 4 )3 = x6 + 3x4 y 4 + 3x2 y 8 + y 12 =
x6 + o(k(x, y)k6 ) e x2 + y 4 ≤ x2 + y 2 para k(x, y)k suficientemente pequeno.

Exemplo 2.4.4 Seja


g(x, y) = sen(x2 − y 2 ).
e suponhamos que pretendemos obter o polinómio de Taylor de sétima ordem de g relativo a (0, 0).
Sabemos que o seno é uma função inteira cuja série de Taylor relativa a 0 (série de Mac
Laurin) é
λ3 λ5 k+1 λ
2k−1
sen λ = λ − + − · · · + (−1) + ...
3! 5! (2k − 1)!
Tal permite-nos ter um palpite àcerca do polinómio de Taylor pretendido simplesmente por substi-
tuição formal de λ por x2 − y 2 na igualdade anterior e só considerando os termos de grau menor
ou igual a sete. Obtem-se um polinómio
3
(x2 − y 2 )
Q(x, y) = (x2 − y 2 ) −
3!
Resta provar que efectivamente se trata do polinómio de Taylor pretendido. Para tal usa-se a
caracterização (2.5) do polinómio de Taylor. De facto
λ3
sen λ − λ + 3!
lim =0
λ→0 λ4

24 de Janeiro de 2000 24
2.4. POLINÓMIO DE TAYLOR

donde resulta
g(x, y) − Q(x, y)
lim 4 =0
(x,y)→(0,0) (x2 − y 2 )

e usando |x2 − y 2 | ≤ x2 + y 2 obtém-se

g(x, y) − Q(x, y)
lim 4 = 0.
(x,y)→(0,0) (x2 + y 2 )

Assim Q é de facto o polinómio de Taylor pretendido e inclusivamente é idêntico ao polinómio


de Taylor de oitava ordem. Note que obtivemos, por exemplo, que todas as derivadas parciais de
ordens 1, 3, 4, 5, 7 e 8 de g em (0, 0) são nulas.

2 2
Exercı́cio 2.4.4 Desenvolva em fórmula de Taylor f (x, y) = ex +y até à terceira ordem. Tente
não calcular as derivadas directamente mas sim usar o facto de que o polinómio de Taylor de
ordem k é o único polinómio de grau ≤ k tal que

|f (x) − p(x)|
lim = 0. (2.8)
kx−yk→0 kx − ykk

Exercı́cio 2.4.5 Calcule a expansão em potências de x − 1 e y − 2 de

sen(x + y − 3)

até à quarta ordem.

2.4.1 Exercı́cios suplementares


Exercı́cio 2.4.6 Calcule a expansão de Taylor em torno do ponto (1, 1, 1), até à quinta ordem de
xy + xyz + x2 + y 2 + xyz.

Rx
Exercı́cio 2.4.7 Seja f uma função C ∞ . Desenvolva 0
f (s)ds em série de Taylor em torno de
0.

2
+sen((y−1)2 )
Exercı́cio 2.4.8 Calcule a expansão em série de Taylor da função ex até à quarta
ordem em torno de x = 0 e y = 1.

Exercı́cio 2.4.9 Calcule a expansão em série de Taylor de

sen x1000 + y 1000 + z 1000




até à ordem 999 em torno da origem.

Exercı́cio 2.4.10 Suponha que f : R → R e v : R2 → R são de classe C ∞ e satisfazem


( 2
∂v ∂ v
= ∂x
∂t 2

v(x, 0) = f (x).

Desenvolva v em série de Taylor em torno da origem.

25 24 de Janeiro de 2000
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL

2.4.2 Sugestões para os exercı́cios

2.4.6 Neste caso a fórmula de Taylor coincide com o próprio polinómio xy + xyz + x2 + y 2 + xyz
(veja o teorema 2.4.1). J
Rx 0 x2 (n−1) xn
2.4.7 0 f (s)ds = f (0)x + f (0) 2 + . . . + f (0) n! + . . .. J
6
t2
2.4.8 Note que sen((y − 1)2 ) = (y − 1)2 + (y−1)
6 + o(|y − 1|6 ) e que et = 1 + t + 2 + o(t3 ) pelo
2 2 2
que ex +sen((y−1) ) = 1 + x2 + (y − 1)2 + x2 + (y − 1)2 + o(k(x, y − 1)k4 ). J
2.4.9 Repare que sen(t) = t + o(t2 ) para t numa vizinhança da origem. J
∂v ∂2f ∂2v ∂3f
2.4.10 Note que, utilizando a equação, se tem ∂t (0, 0) = ∂x2 (0), ∂t∂x (0, 0) = ∂x3 (0). Use o
método de indução. J

24 de Janeiro de 2000 26
Capı́tulo 3

Extremos

Problemas envolvendo maximização ou minimização de funções envolvendo diversos parâmetros


estão entre os mais importantes em Matemática. Aparecem frequentemente em fı́sica (por exemplo
a mecânica lagrangeana), engenharia (maximizar a resistência de um mecanismo ou eficiência
de um motor) ou economia (minimizar custos de produção ou optimizar investimentos). Neste
capı́tulo vamos estudar métodos para determinar máximos e mı́nimos de funções definidas em
subconjuntos de Rn com valores em R.
O leitor já deve conhecer que, para funções reais de variável real, os candidatos a pontos de
extremo de entre os pontos interiores onde a função é diferenciável são exactamente aqueles onde a
derivada se anula, chamados pontos de estacionaridade. A generalização deste facto para funções
de mais de uma variável, a discutir mais à frente, são os pontos onde o gradiente da função se
anula. Tal condição estabelece o chamado sistema de estacionaridade cujas soluções serão ainda
conhecidas por pontos de estacionaridade.
O teorema de Taylor será utilizado para a classificação de pontos de estacionaridade de uma
função de classe C 2 quanto a serem pontos de mı́nimo, máximo ou pontos de sela. Quanto a
este último ponto é de notar que, num caso concreto, os critérios baseados na fórmula de Taylor
poderão ser insuficientes por diversas razões e tal é abundantemente exemplificado nos exercı́cios1

• Uma função pode ter um extremo num ponto onde não estão definidas algumas das derivadas
parciais de primeira ordem.

• Uma função pode ter um extremo num ponto fronteiro do seu domı́nio.

• Uma função pode ter um extremo num ponto de estacionaridade não sendo de classe C 2
numa qualquer vizinhança desse ponto.

• Os critérios baseados na fórmula de Taylor podem ser inconclusivos.

Adicionalmente tais métodos pressupõem que o sistema de estacionaridade da função é expli-


citamente resolúvel o que, dado a sua não linearidade, é algo que em geral não se verificará.
Em tais casos uma sistematização de todos os possı́veis métodos de ataque ao problema de
determinação dos pontos de extremo local de uma função é impossı́vel. Cremos no entanto que os
raciocı́nios mais interessantes estão bem exemplificados a seguir.
Alguns dos métodos a utilizar pressupõem alguns conhecimentos de Álgebra Linear. Como
referência sugere-se [4].
1 Exemplos tı́picos para reais de variável real com o domı́nio da função o intervalo [−1, 1]: x 7→ |x|,
( funções
e−1/x2 se x 6= 0,
x 7→ x, x 7→ |x|3/2 , x 7→
0 caso contrário.

27
CAPÍTULO 3. EXTREMOS

0.2 0.3

0.2
0.1
0.1

-1.5 -1 -0.5 0.5 1 1.5 -2 -1 1 2

-0.1
-0.1
-0.2

−x2 +x4 x3
Figura 3.1: Os gráficos de f (x) = 4
− 6
e g(x) = x4 − x2 .

3.1 Extremos
Provavelmente o leitor terá uma ideia intuitiva do que é um ponto de extremo de uma função, ou
seja, um ponto de máximo ou de mı́nimo. Começaremos portanto por formalizar estas ideias do
ponto de vista matemático. A primeira definição é a de máximo e mı́nimo local de uma função
real.

Definição 3.1.1 Seja f : A → R, com A ⊂ Rn . Um ponto x0 ∈ A é um ponto de máximo (resp.


mı́nimo) local e f (x0 ) máximo (resp. mı́nimo) local de f se existir uma vizinhança2 V de x0 tal
que , ∀x ∈ V ∩ A,
f (x) ≤ f (x0 ), (resp. f (x) ≥ f (x0 )).

Note que, de acordo com a definição anterior, uma função pode ter vários extremos locais cada
um deles ocorrendo em vários pontos de extremo local.

Exemplo 3.1.1 Seja f a função definida em R, constante igual a 1. Então qualquer número real
é um ponto de máximo (e também mı́nimo) de f .

O último exemplo ilustra a necessidade de distinguir estes casos degenerados de outros mais inte-
ressantes. Assim temos a seguinte definição.

Definição 3.1.2 O máximo (resp. mı́nimo) é estrito se a igualdade na definição anterior só se
verificar para x = x0 . O máximo (resp. mı́nimo) é global (ou absoluto) se, ∀x ∈ A

f (x) ≤ f (x0 ), (resp. f (x) ≥ f (x0 )).

2 4 3
Exemplo 3.1.2 A função f (x) = −x 4+x − x6 tem um máximo local em x = 0, um mı́nimo local
em x = − 21 e um mı́nimo absoluto em x = 1, como se pode observar na figura 3.1. A função
g(x) = x4 − x2 tem um mı́nimo absoluto para x = 1. No entanto, este mı́nimo não é único pois
x = −1 é outro ponto de mı́nimo absoluto tendo-se g(1) = g(−1). Veja a figura 3.1.

Exemplo 3.1.3 Provemos que a função f (x) = x2 tem um mı́nimo absoluto estrito na origem.
Tal decorre de f (0) = 0 < x2 = f (x) para x 6= 0.

Exercı́cio 3.1.1 Seja f : A → R, com A = {a}, o conjunto só com um ponto. Justifique que
x = a é ponto de mı́nimo e ponto de máximo estrito simultaneamente.

Nem sempre dada uma função podemos garantir a existência de máximos ou mı́nimos, como
se pode ver pelos exemplos seguintes:
2 Por exemplo, uma bola de raio  centrada em x0 .

24 de Janeiro de 2000 28
3.1. EXTREMOS

7.5

2.5

-15 -10 -5 5 10 15
-2.5

-5

-7.5

x
Figura 3.2: O gráfico de f (x) = 2
+ sen x

Exemplo 3.1.4 Seja f : ]0, 1[ → R definida por f (x) = x. Note que f não tem mı́nimo nem
máximo pois não fazem parte do domı́nio os pontos 0 e 1 onde a função definida pela mesma
fórmula mas cujo domı́nio fosse o intervalo fechado [0, 1] atinge os seus valores extremos.

Exemplo 3.1.5 Seja f : R → R definida por f (x) = x2 + sen x. Embora f tenha máximos e
mı́nimos locais (ver figura 3.2) f não tem nenhum máximo ou mı́nimo global pois limx→+∞ f (x) =
+∞ e limx→−∞ f (x) = −∞.

Exemplo 3.1.6 Seja f (x) = x2 se x ∈ R \ {0}, f (0) = 1. Esta função não tem nenhum mı́nimo
pois f nunca se anula embora f tome valores positivos arbitrariamente pequenos.

Exercı́cio 3.1.2 Seja f a função do exemplo 3.1.6. Mostre que f (0) é um máximo local mas não
global.

Antes de prosseguirmos convém sumarizar informalmente o que aprendemos nos 3 últimos


exemplos. A função do exemplo 3.1.4 não tem máximo nem mı́nimo porque retirámos os extremos
a um intervalo limitado e fechado fazendo com que os valores extremos da função não sejam
atingidos nesses pontos. No exemplo seguinte não encontramos extremos absolutos pois a função
é ilimitada o que é possı́vel graças para uma função contı́nua se o domı́nio não é compacto (neste
caso não é limitado). Finalmente no último destes exemplos a função não tem mı́nimo porque
ocorre uma descontinuidade no ponto onde o mı́nimo deveria ocorrer.
Estes exemplos sugerem que, para garantir a existência de extremos, seja usual tentar lidar com
funções contı́nuas definidas em conjuntos limitados e fechados (compactos). O próximo teorema
mostra que estas condições são efectivamente suficientes para garantir a existência de extremos:

Teorema 3.1.1 (Weierstrass)


Seja f : A ⊂ Rn → R contı́nua com A compacto. Então f tem máximo e mı́nimo (globais) em A.

Ideia da demonstração.Veja o exercı́cio 2.1.16.


Ficamos assim com um critério abstracto para garantir a existência de máximos e mı́nimos, inde-
pendentemente da aparência mais ou menos complicada da definição da função:

sen(x+log(x+1))
Exemplo 3.1.7 A função f : [0, 1] → R dada por f (x) = e 1+100x2 é contı́nua e [0, 1].
Portanto tem pelo menos um ponto de máximo e um ponto de mı́nimo globais em [0, 1].

Exemplo 3.1.8 Consideremos o subconjunto K ⊂ R2 definido pela condição |x| + |y| ≤ 1. Seja
f a função aı́ definida por f (x, y) = x2 + y 2 . Como K é compacto (porque é limitado e fechado),
f tem de ter máximo e mı́nimo. Reparando que f é o quadrado da distância à origem concluı́mos
que ocorre um mı́nimo (global) na origem. Os pontos de máximo serão os pontos do conjunto mais
afastados da origem, que neste caso são (±1, 0) e (0, ±1).

29 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

z = f (x , y)

y0 y

x0

Figura 3.3: Fixar todas as variáveis excepto uma define uma função de uma variável. Se f tiver um
máximo local em (x0 , y0 ) e fixarmos a segunda variável em y0 então tal função tem um máximo em x0 .

Exercı́cio 3.1.3 Diga em quais dos seguintes subconjuntos de R2 pode garantir a existência de
mı́nimos para qualquer função contı́nua f . No caso de a resposta ser negativa apresente um
exemplo.

1. máx{|x|, |y|} = 1

2. máx{|x|, |y|} ≤ 1

3. máx{|x|, |y|} ≥ 1

4. máx{|x|, |y|} > 1

5. máx{|x|, |y|} < 1

Exercı́cio 3.1.4 Mostre que a função f (x) = x4 tem mı́nimo e não tem máximo no intervalo
] − 1, 1[. Porque é que isto não contradiz o teorema de Weierstrass?

Em casos simples é possı́vel seleccionar os candidatos a extremos utilizando raciocı́nios ad hoc.


No exemplo 3.1.8, a função em questão é a distância à origem e por isso tem um mı́nimo em 0. No
entanto, convém ter um critério, de aplicação fácil, que permita reduzir o número de candidatos a
pontos de máximo ou mı́nimo a serem analisados. O resultado do próximo teorema permite fazer
isto, daı́ a sua importância.

Definição 3.1.3 Seja f : A ⊂ Rn → R uma função diferenciável num ponto a ∈ int A. Diz-se
que a é um ponto de estacionaridade (ou ponto crı́tico) de f se ∇f (a) = 0.

Teorema 3.1.2
Seja f : A ⊂ Rn → R uma função diferenciável num ponto x ∈ int A. Se x é ponto de extremo de
f então é ponto de estacionaridade, ou seja ∇f (x) = 0.

Ideia da demonstração. Seja (x1 , . . . , xn ) um ponto de extremo duma função f e considere

gi (t) = f (x1 , . . . , t, . . . , xn ).

gi tem um extremo em t = xi . Aplique o resultado conhecido em dimensão 1 a gi no ponto xi .

24 de Janeiro de 2000 30
3.1. EXTREMOS

Exemplo 3.1.9 Suponhamos que pretendemos encontrar os extremos da função f (x, y) = x2 + y 2


no conjunto x2 + y 2 < 1. Como o conjunto é aberto todos os pontos de extremo de f (se existirem)
serão interiores, pelo que nestes pontos o gradiente de f será nulo, isto é
 
∂f ∂f
∇f = , = (0, 0).
∂x ∂y
Deste modo, resolvendo a equação

∇f = (2x, 2y) = (0, 0),

podemos determinar todos os possı́veis extremos de f . Concluı́mos portanto, que o único ponto em
que pode ocorrer um extremo é (x, y) = (0, 0). Como f (0, 0) = 0 e a função é sempre positiva em
todos os outros pontos este será necessariamente um mı́nimo (absoluto) de f .
O teorema anterior e o teorema de Weierstrass implicam um critério de detecção de pontos de
extremo que sumarizamos no seguinte corolário:

Corolário 3.1.3
Seja f : A → R, A compacto (limitado e fechado) e f contı́nua. Então f tem pelo menos um
ponto de máximo e um ponto de mı́nimo global. Para além disso, os únicos pontos que podem ser
extremos de f são
1. pontos na fronteira de A;
2. pontos onde ∇f = 0;
3. pontos onde f não é diferenciável.

Exercı́cio 3.1.5 Determine (se existirem) os máximos e mı́nimos das seguintes funções:
1. f (x, y) = x4 + y 4 em |x| + y 2 < 1.
2. f (x, y) = x2 − y 2 no conjunto x2 + y 2 < 1.
3. f (x, y) = xy em |x| + |y| < 1.
p
4. f (x, y) = x2 + y 2 em x2 + y 2 < 1.
Porém nem todos os pontos crı́ticos de uma função são máximos ou mı́nimos. Isto motiva a
seguinte definição:

Definição 3.1.4 Diz-se que um ponto de estacionaridade a é um ponto de sela de uma função
f se qualquer que seja a vizinhança de a existirem pontos nessa vizinhança onde a função toma
valores inferiores e superiores a f (a).

Exemplo 3.1.10 Seja f (x) = x3 então 0 é um ponto de sela de f pois embora seja um ponto
crı́tico de f (f 0 (x) = 3x2 anula-se na origem) não se trata de um ponto de máximo ou mı́nimo
(porque f (x) < f (0) para x < 0 e f (x) > f (0) para x > 0).

Exercı́cio 3.1.6 Verifique que (0, 0) é um ponto de sela3 de x2 − y 2 .


No exemplo 3.1.9 e no exercı́cio 3.1.5 os conjuntos onde as funções estavam definidas eram
abertos. Consequentemente todos os pontos de extremo eram pontos de estacionaridade. Não é
este o caso do próximo exemplo, onde nos temos de preocupar com a possibilidade de haver máxi-
mos ou mı́nimos que, por estarem na fronteira do domı́nio, não sejam pontos de estacionaridade.

3 A expressão ponto de sela é motivada pelos gráficos de funçãoes em exemplos como este. Claro que acabamos

por usar a expressão em situações mais gerais.

31 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

Exemplo 3.1.11 Suponhamos que queremos determinar os extremos da função

f (x, y) = xy(1 − x2 − y 2 )

no quadrado [−1, 1] × [−1, 1].


O gradiente de f é dado por

∇f = (y(1 − x2 − y 2 ) − 2x2 y, x(1 − x2 − y 2 ) − 2xy 2 ).

Os pontos de estacionaridade estarão entre as soluções de


(
y − 3x2 y − y 3 = 0
(3.1)
x − 3xy 2 − x3 = 0

no interior do quadrado, isto é, verificando simultaneamente −1 < x < 1 e −1 < y < 1. O sistema
(3.1) admite como soluções:

1. (x, y) = (0, 0);

2. x = 0, y 6= 0 e portanto 1 − y 2 = 0, ou seja (x, y) = (0, ±1);

3. x 6= 0, y = 0 e portanto 1 − x2 = 0, ou seja (x, y) = (±1, 0);

4. pontos que verifiquem x 6= 0, y 6= 0 e


(
3x2 + y 2 = 1
(3.2)
x2 + 3y 2 = 1.

O sistema 3.2 não é linear em (x, y) mas é linear em (x2 , y 2 ) e tem como solução
1 1
x2 = y2 = .
4 4
Deste modo (1/2, 1/2), (−1/2, 1/2), (1/2, −1/2) e (−1/2, −1/2) satisfazem o sistema de estacio-
naridade.
De entre as soluções de (3.1) as que são pontos interiores do domı́nio fornecem a lista de possı́-
veis candidatos a extremos locais em pontos interiores: (0, 0), (1/2, 1/2), (−1/2, 1/2), (1/2, −1/2)
e (−1/2, −1/2). Avaliando a função f nestes pontos obtemos f (0, 0) = f (±1, 0) = f (0, ±1) = 0,
f (±1/2, ±1/2) = 1/8 e f (±1/2, ∓1/2) = −1/8.
Para avaliar o que se passa sobre a fronteira do domı́nio consideramos f (−1, y) = y 3 para
y ∈ [−1, 1], f (1, y) = −y 3 para y ∈ [−1, 1], f (x, 1) = −x3 para x ∈ [−1, 1], f (x, −1) = x3 para
x ∈ [−1, 1]. Todas estas funções de uma variável real são estritamente monótonas de maneira
que basta considerar os valores da função nos vértices do quadrado: f (1, 1) = f (−1, −1) = −1 e
f (−1, 1) = f (1, −1) = 1.
Portanto (1, 1) e (−1, −1) são pontos de mı́nimo global e (1, −1) e (−1, 1) são pontos de máximo
global.
Temos agora de estudar o que acontece nos outros pontos pois podem ser máximos ou mı́nimos
locais ou apenas pontos de sela. Quanto ao ponto (0, 0) é fácil de verificar que xy assume valores
positivos e negativos numa vizinhança da origem. Por outro lado se (x, y) estiver suficientemente
próximo de (0, 0) a função 1 − x2 − y 2 é positiva. Portanto f numa vizinhança da origem assume
valores positivos e negativos. Logo (0, 0) é um ponto de sela.
Quanto ao ponto (1/2, 1/2) classificamo-lo usando um raciocı́nio ad hoc baseado na utilização
do teorema de Weierstrass. Note-se que (1/2, 1/2) é um ponto interior do conjunto compacto
A = {(x, y) ∈ R2 : x2 + y 2 ≤ 1, x ≥ 0, y ≥ 0}, que f vale 0 sobre ∂A e f > 0 no interior de A.
O teorema de Weierstrass garante que f terá um máximo em A (global relativamente a A) que
ocorrerá necessariamente num ponto interior. Tal ponto é então um ponto de estacionaridade. O

24 de Janeiro de 2000 32
3.1. EXTREMOS

A
1/2

-1 1/2 1
0.2 1
0
0.5
-0.2
-1 0
-0.5
0 -0.5
-1
0.5
-1
1

Figura 3.4: Estudo de f (x, y) = xy(1 − x2 − y 2 ) quanto a existência de pontos de extremo em [−1, 1] ×
[−1, 1]. Tente identificar as propriedades deduzidas para a função com o que é evidenciado no gráfico
gerado numericamente à direita.

único ponto de estacionaridade em int A é (1/2, 1/2) logo este ponto é um ponto de máximo local de
f (relativamente ao quadrado [−1, 1] × [−1, 1]). Este raciocı́nio vale para (1/2, −1/2), (−1/2, 1/2)
e (−1/2, −1/2) chegando-se de maneira análoga à conclusão que (1/2, −1/2), (−1/2, 1/2) são
pontos de mı́nimo local e (−1/2, −1/2) um ponto de máximo local (ou use o facto de a função ser
ı́mpar em cada uma das variáveis).

Exercı́cio 3.1.7 Determine, se existirem, os pontos de máximo e mı́nimo local da função (x, y) 7→
xy no quadrado máx{|x|, |y|} ≤ 1.

Para terminar esta secção vamos apresentar um exemplo em que usamos propriedades de
simetria e uma mudança de variável para determinar extremos

Exemplo 3.1.12 Seja f (x, y, z, w) = x2 + y 2 − z 2 − w2 + (x2 + y 2 )2 . Definindo r12 = x2 + y 2 e


r22 = z 2 + w2 temos f (x, y, z, w) = r12 − r22 + r14 . Portanto, determinando os máximos e mı́nimos
de g(r1 , r2 ) = r12 − r22 + r14 , podemos recuperar os máximos e mı́nimos de f .

Exercı́cio 3.1.8 Determine os extremos de g(r1 , r2 ) = r12 − r22 + r14 . Utilize este resultado para
calcular os extremos de f (x, y, z, w) = x2 + y 2 − z 2 − w2 + (x2 + y 2 )2 .

3.1.1 Exercı́cios suplementares


Exercı́cio 3.1.9 Determine os pontos de extremo de:

1. f (x, y, z) = x2 + y 2 + z 2 com |x| + |y| + |z| ≤ 1.

2. f (x, y) = x + y com x2 + y 2 ≤ 1.

3. f (x, y) = x2 + y 2 − (x2 + y 2 )2 .

4. f (x, y) = x3 y 3 (1 − x6 − y 6 ) para (x, y) ∈ [−1, 1] × [−1, 1].

33 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

Exercı́cio 3.1.10 Seja f : R → R, contı́nua, satisfazendo

lim f (x) = +∞.


x→±∞

Prove que f tem pelo menos um mı́nimo.

Exercı́cio 3.1.11 (Mı́nimos quadrados) O método dos mı́nimos quadrados tem como objectivo
determinar a recta y = ax + b que “melhor aproxima” certos dados experimentais (xi , yi ), com
1 ≤ i ≤ n. Uma função que permite medir quanto é que uma dada recta na forma y = ax + b
aproxima os pontos experimentais é
n
X
g(a, b) = (axi + b − yi )2 .
i=1

Calcule os pontos de estacionariade de g para determinar que equações é que a e b satisfazem


(a prova de que o ponto de estacionaridade é mesmo um mı́nimo é deixada para um exercı́cio
posterior).

3.1.2 Sugestões para os exercı́cios


3.1.9

1. Note que f é o quadrado da distância à origem.

2. Como f não tem pontos de estacionaridade em x2 + y 2 < 1 os seus extremos (que existem
pelo teorema de Weirstrass) têm de se encontrar na fronteira. Escreva os pontos da fronteira
com x = cos(θ) e y = sen(θ). Determine os extremos de cos(θ) + sen(θ) com θ ∈ [0, 2π].

3. Determine os extremos de r2 − r4 com r ≥ 0. Faça r2 = x2 + y 2 .

4. Recorde o exemplo 3.1.11 substituindo x ↔ x3 e y ↔ y 3 .

J
3.1.10 Utilize o teorema do valor médio. J
3.1.11 Se g tiver mı́nimo em (a, b) verifica-se ∇g = 0. Portanto a e b satisfazem as equações
Pn Pn    Pn
x2i

Pi=1 i=1 xi a
= i=1 xi yi
.
n P n
i=1 xi n b i=1 yi

3.2 Testes de Segunda Ordem


Nesta secção vamos estudar um método que permite classificar os pontos de estacionaridade de
funções. No caso unidimensional, quando a segunda derivada não se anula, um ponto de estaciona-
ridade de uma função é de máximo ou de mı́nimo dependendo do sinal da segunda derivada. Para
funções f de Rn em R a segunda derivada de f é representada por uma forma blinear definida por
uma matriz chamada hessiana. Classificando a forma quadrática definida pela hessiana quanto a
ser definida positiva, negativa, indefinida, semidefinida,. . . , ou de forma equivalente determinando
o sinal dos seus valores próprios, é possı́vel estudar a classificação de pontos de estacionaridade
quanto a serem pontos de máximo ou mı́nimo. À semelhança do caso unidimensional quando a
derivada é nula, este teste pode não ser conclusivo se a forma quadrática for semidefinida, isto é
todos os valores próprios tiverem o mesmo sinal excepto alguns nulos.
Comecemos por precisar alguns dos termos usados no parágrafo anterior.

24 de Janeiro de 2000 34
3.2. TESTES DE SEGUNDA ORDEM

Definição 3.2.1 Seja A uma matriz simétrica, ou seja A = AT e considere-se a forma quadrática
QA definida por A via QA (x) = x · Ax para x ∈ Rn .
1. Diz-se que A é definida positiva (resp. negativa) se a forma quadrática QA for defininida
positiva (resp. negativa), isto é, QA (x) > 0 (resp. QA (x) < 0) para todo o x ∈ Rn \ {0}.
2. Diz-se que A é semi-definida positiva4 (resp. negativa) se a forma quadrática QA for semi-
defininida positiva (resp. negativa), isto é, QA (x) ≥ 0 (resp. QA (x) ≤ 0) para todo o x ∈ Rn
e existe algum y 6= 0 tal que QA (y) = 0.
3. Caso nenhuma destas situações se verifique diz-se que a matriz é indefinida esta situação
corresponde a QA ser indefinida, isto é, existirem y, z ∈ Rn tais que QA (y) < 0 e QA (z) > 0.
A definição anterior poderia ter sido feita em termos de valores próprios (consultar por exemplo
[4] ou resolver o exercı́cio 3.2.2) graças ao seguinte resultado básico de Álgebra Linear.

Proposição 3.2.1
Seja QA uma forma quadrática definida por uma matriz simétrica A via QA (x) = x · Ax para
x ∈ Rn . Então:
1. QA é definida positiva (resp. negativa) se e só se todos os valores próprios de A forem
positivos (resp. negativos).
2. QA é semi-definida positiva (resp. negativa) se e só se todos os valores próprios de A forem
não negativos (resp. positivos) e pelo menos um nulo.
3. QA é indefinida se existir um valor próprio positivo e um valor próprio negativo.

Exemplo 3.2.1 Seja  


1 2 0
A = 2 4 0 .
0 0 1
Os valores próprios de A são definidos pela equação
 
1−λ 2 0
det(A − λI) =  2 4−λ 0  = λ(1 − λ)(5 − λ) = 0,
0 0 1−λ

que tem como soluções λ = 0, 1, 5. Portanto concluı́mos que A é semi-definida positiva.

Exercı́cio 3.2.1 Mostre que a única matriz simultaneamente semidefinida positiva e semidefinida
negativa é a matriz nula.
Que basta considerar matrizes simétricas ao lidar com formas quadráticas é uma das conclusões
do exercı́cio seguinte.

Exercı́cio 3.2.2 Em geral podemos definir forma quadrática QA associada a uma matriz A via
QA (x) = x · Ax.
T
1. Mostre que QA = QA] , onde A] = A+A 2 em que A] é chamada a simetrização de A.
Portanto substituir A pela sua simetrização não altera QA . Sugere-se que antes de provar o
caso geral, convença-se que este facto é verdadeiro com o exemplo
 
1 2
A= .
0 1
4 Esta definição de forma semidefinida não é a mesma de, por exemplo, [4] aonde uma forma ou matriz definida

é necessariamente semidefinida. Assim definida, indefinida e semidefinida são termos mutuamente exclusivos.

35 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

2. Demonstre a proposição 3.2.1.


Calcular valores próprios não é uma tarefa trivial e é conveniente dispor de critérios mais fáceis
de aplicar.
Proposição 3.2.2
Seja
 
a11 ··· a1n
 .. .. 
A= . . 
an1 ··· ann
uma matriz n × n. Consideremos as submatrizes Ak que consistem nos elementos das primeiras k
linhas e k colunas de A, isto é,
 
  a11 a12
A1 = a11 A2 = ···
a21 a22
Então,
1. A é definida positiva se e só se det Ai > 0 para todo o i.
2. A é definida negativa se e só se det Ai < 0 para i ı́mpar e det Ai > 0 para i par.

Exemplo 3.2.2 Seja  


1 0 1
A = 0 2 0 .
1 0 4
Portanto  
  1 0
A1 = 1 A2 = A3 = A
0 2
e temos
det A1 = 1 det A2 = 2 det A3 = 6.
Como todos estes valores são positivos concluı́mos que A é definida positiva.

Exercı́cio 3.2.3 Prove a proposição para matrizes diagonais.


Para o caso de matrizes semi-definidas o critério é ligeiramente mais complexo. Dada uma
matriz A uma submatriz principal de A é qualquer matriz que se obtém de A suprimindo linhas
e colunas em pares correspondentes (e.g. a primeira e a terceira linhas e colunas).

Exemplo 3.2.3 Seja  


1 2 3 4 5
6 7 8 9 10
 
11
A= 12 13 14 15

16 17 18 19 20
21 22 23 24 25
Suprimindo a primeira linha e primeira coluna obtemos a submatriz principal
 
7 8 9 10
12 13 14 15
 
17 18 19 20
22 23 24 25
Suprimindo a segunda e terceira linhas e colunas obtemos a submatriz principal
 
1 4 5
16 19 20 .
21 24 25

24 de Janeiro de 2000 36
3.2. TESTES DE SEGUNDA ORDEM

Proposição 3.2.3
Uma matriz A é semi-definida positiva se e só se todas as submatrizes principais de A têm deter-
minantes não negativos e pelo menos um é nulo. Uma matriz A é semi-definida negativa se e só se
todas as submatrizes principais de A têm determinantes não negativos ou não positivos conforme
o número de linhas ou colunas da submatriz é par ou ı́mpar e pelo menos um é nulo.

Exemplo 3.2.4 Seja  


0 0 0
A = 0 2 1 .
0 1 −5
 
Retirando a primeira e terceira linhas e colunas obtemos a submatriz 2 cujo  determinante
 é
positivo. Retirando a primeira e segunda linhas e colunas obtemos a submatriz −5 cujo determi-
nante é negativo. Portanto concluı́mos que a matriz não pode ser nem semidefinida positiva nem
semidefinida negativa pelo que é indefinida.

Exemplo 3.2.5 Seja  


0 0 0
A = 0 2 1 .
0 1 5
O determinante de A é zero pelo que a matriz não pode ser nem definida positiva nem definida
negativa. O mesmo acontece ao determinante de qualquer submatriz obtida de A não retirando a
primeira linha e coluna. Portanto basta  analisar 3 submatrizes; retirando a primeira e segunda
linhas e colunas obtemos a submatriz 5 cujo   determinante é positivo; retirando a primeira e
terceira linhas e colunas obtemos a submatriz 2 cujo determinante é positivo; retirando a primeira
linha e coluna obtemos a submatriz  
2 1
1 5
cujo determinante é 9 e portanto também positivo. Portanto concluı́mos que a matriz é semidefi-
nida positiva.

Exercı́cio 3.2.4 Classifique a matriz A dada por


 
3 0 0
A = 0 2 1
0 1 5
quanto a ser definida ou semidefinida positiva, negativa ou indefinida

Exercı́cio 3.2.5 Classifique a matriz A dada por


 
0 2 1
A = 0 2 1
0 1 5
quanto a ser definida ou semidefinida positiva, negativa ou indefinida
Depois destas definições preliminares vamos definir a matriz hessiana5 .

Definição 3.2.2 Seja f : Rn → R de classe C 2 . A matriz hessiana de f , H(f ), é dada por


 ∂2f 2
· · · ∂x∂1 ∂x
f

∂x21 n
 . .. 
 ..
H(f ) =  . .

∂2f ∂2f
∂xn ∂x1 ··· ∂x2 n

5A matriz hessiana H define uma forma bilinear (x, y) 7→ x · Hy que desempenha o papel de segunda derivada
de uma função de Rn em R. Não desenvolveremos este assunto neste texto.

37 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

Exemplo 3.2.6 Seja f (x, y) = x2 + y 2 . A sua matriz hessiana é


 
2 0
H(f ) = .
0 2

Exercı́cio 3.2.6 Calcule a matriz hessiana de f (x, y, z) = xyz.

Exercı́cio 3.2.7 1. Defina uma função cuja matriz hessiana seja, em qualquer ponto
 
a b
.
b c

2. Será que a função que encontrou na alı́nea anterior é única? Se não for tente encontrar uma
fórmula geral para esta famı́lia de funções.
3. Em que condições é que a matriz  
a b
d c
é a hessiana de alguma função de classe C 2 ?
O resultado básico para classificar pontos de estacionaridade usando o termo de segunda ordem
da fórmula de Taylor é

Teorema 3.2.4
Sejam U ⊂ Rn um aberto, f : U → R uma função de classe C 2 (U ) e x0 ∈ U um ponto de
estacionaridade de f .
(2)
i) Se Dh f (x0 ) > 0 para todo o h 6= 0 então x0 é um ponto de mı́nimo local;
(2) (2)
ii) Se Dh f (x0 ) ≥ 0 para todo o vector h e existe um vector k 6= 0 tal que Dk f (x0 ) = 0 então
x0 não é um ponto de máximo local;
(2)
iii) Se Dh f (x0 ) < 0 para todo o h 6= 0 então x0 é um ponto de máximo local;
(2) (2)
iv) Se Dh f (x0 ) ≤ 0 para todo o vector h e existe um vector k 6= 0 tal que Dk f (x0 ) = 0 então
x0 não é um ponto de mı́nimo local;
(2) (2)
v) Se existem h, k ∈ Rn tais que Dh f (x0 ) < 0 e Dk f (x0 ) > 0 então x0 é um ponto de sela.
Ideia da demonstração. Para provar (ii), (iv) e (v) basta considerar as restrições de f às rectas
passando por x0 e nas direcções de h ou k e usar os resultados conhecidos6 para dimensão 1. Para
provar (i) ou (iii) devemos estudar o sinal de f (x) − f (x0 ) provando que se mantém constante
numa bola de raio suficientemente pequeno centrada em x0 . Isto é equivalente a estudar o sinal
de
f (x0 + h) − f (x0 ) 1 (2) Ef (x0 , h)
2 = Dh/|h| f (x0 ) + 2
|h| 2 |h|
em que a última parcela do segundo membro tende para 0 quando h → 0 de acordo com o teorema
de Taylor. Para completar a demonstração, por exemplo no caso (i), basta mostrar que para
(2)
h 6= 0 temos Dh/|h| f (x0 ) minorado por um número m > 0 e que existe uma bola centrada em x0
E (x ,h)
tal que aı́ f |h|02 > −m. O último destes dois factos segue da definição de limite e o primeiro
pode ser justificado usando resultados de álgebra linear sobre formas quadráticas ou o teorema de
(2)
Weierstrass aplicado à função7 S n−1 3 η 7→ Dη f (x0 ).
6 Obviamente pode refazer-se a demonstração mas queremos acentuar que não existe nenhuma ideia essencial-
mente nova em jogo.
7 S n−1 ≡ {x ∈ Rn : |x| = 1}.

24 de Janeiro de 2000 38
3.2. TESTES DE SEGUNDA ORDEM

O teorema anterior pode ser enunciado usando a terminologia de álgebra linear referente a
(2)
formas quadráticas. Com efeito
h Dh f (x
i 0 ) é a forma quadrática definida pela matriz hessiana de
∂2f (2)
f no ponto x0 , Hf (x0 ) ≡ ∂xi ∂xj (x0 ) , isto é, Dh f (x0 ) = h · Hf (x0 )h. As situações
i,j=1,...,n
(i-v) no enunciado do teorema correspondem respectivamente a esta forma quadrática8 ser defi-
nida positiva, semidefinida positiva não nula, definida negativa, semidefinida negativa não nula e
indefinida.

Corolário 3.2.5
Seja f : U ⊂ Rn → R uma função de classe C 2 numa vizinhança um ponto de estacionaridade em
x0 . Então:

1. Se H(f )(x0 ) = 0 o teste é inconclusivo.

2. Se H(f )(x0 ) for definida positiva (resp. negativa) então x0 é um ponto de mı́nimo (resp.
máximo) local.

3. Se H(f )(x0 ) for semi-definida positiva (resp. negativa) mas não nula então x0 não é um
ponto de máximo (resp. mı́nimo) local, isto é, pode ser ponto de mı́nimo (resp. máximo)
local ou ponto de sela.

4. Se H(f )(x0 ) for indefinida então x0 é um ponto de sela.

O teorema e o corolário não podem ser melhorados, através de informação só relativa a derivadas
de segunda ordem e de maneira a fornecer informação adicional para os casos em que a forma
quadrática é semidefinida, devido aos exemplos triviais que se seguem (3.2.8, 3.2.9).

Exemplo 3.2.7 Seja f (x, y) = x2 +y 2 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).


A matriz hessiana de f no ponto (0, 0) é
 
2 0
H(f ) = ,
0 2

que é definida positiva (os valores próprios são positivos). Portanto (0, 0) é um ponto de mı́nimo
local.

Exemplo 3.2.8 Seja f (x, y) = x2 +y 4 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).


A matriz hessiana de f no ponto (0, 0) é
 
2 0
H(f ) = ,
0 0

que é semi-definida positiva (os valores próprios são não negativos). Portanto (0, 0) não é um
ponto de máximo local. É fácil verificar que (0, 0) é um ponto de mı́nimo local e não um ponto de
sela. Com efeito, basta observar que, se (x, y) 6= (0, 0), se tem f (x, y) > f (0, 0) = 0.

Exemplo 3.2.9 Seja f (x, y) = x2 −y 4 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).


A matriz hessiana de f no ponto (0, 0) é
 
2 0
H(f ) = ,
0 0

que é semi-definida positiva (os valores próprios são não negativos). Portanto (0, 0) não é um
ponto de máximo local. No entanto (0, 0) não é um ponto de mı́nimo local; com efeito, temos
f (0, 0) = 0 mas f (0, y) = −y 4 < 0 para y 6= 0 pelo que concluı́mos que (0, 0) é um ponto de sela.
8 Esta terminologia relativa a formas quadráticas usa-se também para as matrizes que as definem.

39 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

Exemplo 3.2.10 Seja f (x, y) = x2 − y 2 . O ponto (0, 0) é um ponto de estacionaridade (verifi-


que!). A matriz hessiana de f no ponto (0, 0) é
 
2 0
H(f ) = ,
0 −2

que é indefinida (um dos valores próprios é positivo e outro é negativo). Portanto (0, 0) é um
ponto de sela.

Exercı́cio 3.2.8 Prove que (0, 0) é um ponto de estacionaridade de f e classifique-o quanto a ser
ponto de máximo, ponto de mı́nimo ou ponto de sela quando f é definida em R2 por:

1. f (x, y) = 2x2 + y 2 ;

2. f (x, y) = xy;

3. f (x, y) = x2 + 2xy + y 2 ;

4. f (x, y) = y 4 − x4 ;

5. f (x, y) = x3 ;

6. f (x, y) = y 2 .

Problema 3.2.1 Elabore


 um critério para classificar formas quadráticas definidas por uma matriz
2 × 2 da forma ab cb em função do sinal de d = ac − b2 e do sinal de a.

Os exemplos de aplicação do critério de segunda ordem até agora apresentados são no essencial
triviais e poderiam ser analisados por outros processos. Destinavam-se a definir situações tı́picas
e balizar as limitações do resultado. O exemplo seguinte já tem um carácter menos trivial.

Exemplo 3.2.11 Considere-se a função f : R2 → R definida por f (x, y) = xy + x2 y 3 − x3 y 2 .


Tentemos estudá-la quanto à existência de extremos.
Começamos por notar que graças a f ser um polinómio reconhecemos imediatamente que f
coincide com o seu desenvolvimento de Taylor de ordem igual ou superior ao seu grau. Tal é ver-
dadeiro em particular relativamente a (0, 0) que reconhecemos como um ponto de estacionaridade
(ausência de termos de primeira ordem) que é um ponto de sela (termo de segunda ordem xy).
Para determinar outros pontos de estacionaridade consideramos o sistema de estacionaridade

∂f
≡ y + 2xy 3 − 3x2 y 2 = 0


∂x

 ∂f ≡ x + 3x2 y 2 − 2x3 y = 0


∂y

que pode ser escrito de forma equivalente como


(
y(1 + 2xy 2 − 3x2 y) = 0
x(1 + 3xy 2 − 2x2 y) = 0.

Daı́ decorre que a única solução sobre os eixos coordenados é (0, 0) que já foi estudada. Podemos
então limitarmo-nos a analisar (
1 + 2xy 2 − 3x2 y = 0
1 + 3xy 2 − 2x2 y = 0.
Subtraindo termo a termo obtemos xy 2 + x2 y = 0 ou seja xy(y + x) = 0. Assim eventuais soluções
adicionais do sistema de estacionaridade encontrar-se-iam ou sobre os eixos coordenados (hipótese
já estudada) ou sobre a recta y = −x. Substituindo y por −x na primeira equação obtemos

24 de Janeiro de 2000 40
3.2. TESTES DE SEGUNDA ORDEM

1 + 5x3 = 0 o que fornece um segundo e último ponto de estacionaridade: (−5−1/3 , 5−1/3 ). Para
classificá-lo calculamos

∂2f
= 2y 3 − 6xy 2
∂x2
∂2f
= 6x2 y − 2x3
∂y 2
∂2f
= 1 + 6xy 2 − 6x2 y
∂x∂y
pelo que  
−1/3 −1/3 8/5 7/5
Hf (−5 ,5 )=
7/5 8/5
uma matriz definida positiva pelo que este ponto de estacionaridade é um ponto de mı́nimo local
sendo o mı́nimo local f (−5−1/3 , 5−1/3 ) = − 35 5−2/3 .
Considerando, por exemplo, limλ→+∞ f (1, λ) = +∞, limλ→+∞ f (λ, 1) = −∞ verifica-se que
esta função não tem extremos absolutos.
O teorema 3.2.4 é passı́vel de várias generalizações. Aconselha-se no entanto o aluno a começar
por dominar o critério de segunda ordem e as ideias na sua demonstração pois são a base de
qualquer uma dessas generalizações. Mais geralmente um polinómio homogéneo de grau k designa-
se por forma de grau k. Uma generalização imediata do resultado anterior é

Problema 3.2.2 Seja f : D ⊂ Rn → R uma função de classe C k (D) e x0 um ponto interior a D


(j) (k)
tal que Dh f (x0 ) = 0 para j < k e h ∈ Rn e a forma de grau k Q definida por Q(h) = Dh f (x0 )
é definida positiva. Prove que x0 é um ponto de mı́nimo local de f . Formule e demonstre outras
generalizações do mesmo tipo do teorema 3.2.4.
Generalizações deste tipo poderão ser encontradas por exemplo em [2] (ver também o exercı́cio
3.2.12 e o problema 3.2.4). Factos triviais mas muito úteis são

Problema 3.2.3

a) Seja Q uma forma não nula de grau ı́mpar. Prove que Q é uma forma indefinida.
b) Seja P um polinómio de grau ı́mpar. Prove que P não é limitado superior ou inferiormente.

Exemplo 3.2.12 Considere-se a função g : R2 → R definida por


2
−y 2
g(x, y) = ex + y2 .

e tentemos classificar o ponto de estacionaridade (0, 0).


De maneira análoga ao exemplo 2.4.4 obtemos a partir da série de Taylor da exponencial

X (x2 − y 2 )j
g(x, y) = 1 + x2 +
j=2
j!

para todo o (x, y) ∈ R2 . Note-se que a análise através do termo de segunda ordem da fórmula de
Taylor só nos permite afirmar que (0, 0) não é um ponto de máximo devido à forma quadrática se
anular na direcção do eixo dos y’s. Podemos tentar compreender o que se passa usando os termos
de ordem superior da fórmula de Taylor naquela direcção. O primeiro desses termos que não se
anula é de ordem 4, mais precisamente,
2
(x2 − y 2 )
g(x, y) = 1 + x2 + + E(x, y)
2

41 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

em que (xE(x,y)
2 +y 2 )2 → 0 quando (x, y) → 0. É de suspeitar que (0, 0) é um ponto de mı́nimo e
tentaremos prová-lo usando o mesmo raciocı́nio da demonstração do teorema 3.2.4 em que a
minimização do termo de segunda ordem por um número positivo é substituı́da pela minimização
simultânea dos termos de segunda e quarta ordem. A ideia natural é usar o termo de quarta
ordem para direcções “próximas” da do eixo dos y’s e o termo de segunda ordem para as restantes.
Como o termo de quarta ordem se anula para |x| = |y| e o de segunda ordem para x = 0 tentamos
caracterizar tais direcções respectivamente por |x| < 12 |y| e |x| ≥ 12 |y|.
Seja então |x| < 21 |y|. Obtemos
 
1 1 (2) 1 (4)
2 D g(0, 0) + D g(0, 0)
(x2 + y 2 ) 2 (x,y) 4! (x,y)
2
!
1 2 (x2 − y 2 ) 1 (x4 − 2x2 y 2 + y 4 ) 8 x4 − 12 y 4 + y 4 4
= 2 x + > 2 > 4
> .
(x2 + y 2 ) 2 5 2
( y ) 2 25 y 25
4
1
Por outro lado para |x| ≥ 2 |y| obtém-se
 
1 1 (2) 1 (4)
2 D(x,y) g(0, 0) + D(x,y) g(0, 0)
(x2 + y 2 ) 2 4!
2
!
1 (x2 − y 2 )
2 x2 x2 + y 2 1
= 2 x + > 2 ≥ 2 = .
(x2 + y2 ) 2 (x2 + y2 ) 4(x2 + y 2 ) 4(x2 + y 2 )

Agora já é possı́vel aplicar um raciocı́nio idêntico ao do teorema 3.2.4 para concluir que (0, 0) é
efectivamente um ponto de mı́nimo.
O leitor poderá ter considerado a resolução do exercı́cio 3.2.12 algo ad hoc e suspeitado que
existe um resultado abstracto que poderia ter sido usado. De facto assim é embora a maior parte
das ideias relevantes já conste da resolução do exercı́cio.

Problema 3.2.4 Sejam f : D ⊂ Rn → R, f ∈ C k (D), x0 um ponto interior a D. Suponha-se


(j)
que existe l < k tal que Dh f (x0 ) = 0 para todo o j < l e todo o h ∈ Rn , e que h 7→ Ql (h) ≡
(l)
Dh f (x0 ) é semidefinida positiva. Designamos os vectores unitários que anulam Ql como direcções
(j)
singulares. Suponha-se ainda que Dη f (x0 ) = 0 para toda a direcção singular η e l < j < k e que
(k)
Qk (η) ≡ Dη f (x0 ) > 0 para toda a direcção singular η. Mostre que:
a) O conjunto formado por todas as direcções singulares é um subconjunto fechado de S n−1 que
desigamos por F .
b) Qk tem um mı́nimo m1 > 0 sobre F e um mı́nimo m2 sobre S n−1 .
m1
c) Existe um aberto A ⊃ F tal que Qk (η) > 2 para todo o η ∈ S n−1 ∩ A.
d) Ql tem um mı́nimo m3 > 0 sobre S n−1 \ A.
e) Valem as estimativas
m3 E (x0 ,x−x0 )
+ mk!2 + f|x−x x−x0
(
f (x) − f (x0 ) l!|x−x0 |k−l k se |x−x0 | 6∈ A,
0|
k
≥ m1 Ef (x0 ,x−x0 ) x−x0
|x − x0 | 2k! + |x−x0 |k
se |x−x0 | ∈ A,
Ef (x0 ,x−x0 )
em que |x−x0 |k
→ 0 quando x → x0 .

f ) x0 é um ponto de mı́nimo local de f .


Para terminar convém referir mais uma vez que os testes baseados na fórmula de Taylor podem
ser inconclusivos devido às razões apontadas na introdução a este capı́tulo e aı́ exemplificadas com
funções reais de variável real.

24 de Janeiro de 2000 42
3.2. TESTES DE SEGUNDA ORDEM

3.2.1 Exercı́cios suplementares


Exercı́cio 3.2.9 Considere a função f : R3 → R definida por
 p 2  p 3
f (x, y, z) = 2 − z − x2 + y 2 + z − x2 + y 2 .

a) Determine os respectivos pontos de extremo local e absoluto e, se tais pontos existirem,


classifique-os quanto a serem pontos de máximo ou de mı́nimo.

b) Determine um polinómio de grau menor ou igual a dois, P (x, y, z), tal que

f (x, y, z) − P (x, y, z)
lim 2 2 = 0,
(x,y,z)→(1,1,0) (x − 1) + (y − 1) + z 2

ou justifique que tal polinómio não existe.

Exercı́cio 3.2.10 Considere a função g : R3 → R definida por


 p 
g(x, y, z) = x3 (y 2 + z 2 ) 1 − x − y 2 + z 2 .

Estude g quanto à existência de extremos relativos e absolutos. Determine tais extremos se exis-
tirem e os pontos onde ocorrem. Sugestão: Considere primeiro h(x, ρ) = x3 ρ2 (1 − x − ρ).

Exercı́cio 3.2.11 Seja f : R2 → R definida por


xy 5
(
x2 +y 4 , se (x, y) 6= (0, 0)
f (x, y) =
0, se (x, y) = (0, 0).

a) Determine justificadamente o maior subconjunto do domı́nio de f em que existem e são


∂2f ∂2f
iguais as derivadas parciais ∂x∂y e ∂y∂x .

b) Determine e classifique os pontos de estacionaridade de f quanto a serem pontos de extremo


ou pontos de sela.

c) Determine o máximo e o mı́nimo da restrição de f ao conjunto A = {(x, y) ∈ R2 : x ≥


y 2 , y ≤ −x2 } e os pontos em que ocorrem esses extremos.

Exercı́cio 3.2.12 Considere a função f : R2 → R definida por

f (x, y) = (y + x2 )(x − y 2 ) + 1.

Determine, se existirem, os pontos de estacionaridade de f e classifique-os quanto a serem pontos


de extremo relativo ou pontos de extremo absoluto.

3.2.2 Sugestões para os exercı́cios


3.2.9
p
a) A função é constante sobre cada uma das superfı́cies de equação z − x2 + y 2 = α, α ∈ R
2 3
p a função R 3 α 7→ 2 − α + α . Conclui-se
pelo que basta estudar p facilmente que f tem um
máximo para z − x + y = 0 e um mı́nimo para z − x2 + y 2 = 2/3. Tais extremos não
2 2

são absolutos.

b) Tal polinómio existe e é obviamente o polinómio de Taylor de segunda ordem de f relativo


ao ponto (1, 1, 0).

43 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

Figura 3.5: Esta figura acompanha


p a sugestão de solução do exercı́cio 3.2.9. A função f é constante sobre
cada uma das folhas de cone z − x2 + y 2 = α.

J
3.2.10 Já vimos no exercı́cio 3.2.9 as vantagens em, quando possı́vel, usar simetrias da função
a estudar para estudar um problema equivalente em dimensão inferior. Naquele caso acabámos
estudando um problema unidimensional. No caso presente podemos estudar, usando a sugestão,
um problema bidimensional do qual recuperaremos o problema original por rotação em torno do
eixo dos x’s.
Vamos então estudar quanto à existência de extremos a função g : {(x, ρ) ∈ R2 : ρ ≥ 0} → R
definida por g(x, ρ) = x3 ρ2 (1 − x − ρ). Algo que convém fazer antes de iniciar qualquer tipo
de cálculo é tentar identificar linhas de nı́vel da função. A intersecção num ponto interior de
tais linhas de nı́vel formando um ângulo não nulo fornece-nos imediatamente a localização de um
ponto de estacionaridade9 . Tal é particularmente fácil para g pois esta função anula-se sobre o
eixo dos x’s, sobre o eixo dos ρ’s e sobre a recta 1 − x − ρ = 0. Isto identifica como ponto de
estacionaridade (x, ρ) = (1, 0) e se considerássemos a função estendida para ρ < 0 usando a mesma
fórmula o mesmo se poderia dizer dos pontos (0, 1) e (0, 0). É fácil de verificar por análise do sinal
de g que todos estes pontos são pontos de sela. Uma observação adicional que se obtém dessa
análise é o facto de g ser positiva no interior do triângulo T limitado pelas rectas atrás referidas,
isto é,
T = {(x, ρ) ∈ R2 : x ≥ 0, ρ ≥ 0, x + ρ ≤ 1}.
Como T é limitado e fechado há-de existir no interior de T pelo menos mais um ponto de máximo
de g que será portanto mais um ponto de estacionaridade de g. Eventualmente existirão outros
pontos de estacionaridade. Todos estes factos servirão para verificar a resolução do sistema de
estacionaridade de g (
∂g 2 2
∂x ≡ x ρ (3(1 − x − ρ) − x) = 0
∂g 3
∂ρ ≡ x ρ(2(1 − x − ρ) − ρ) = 0.

Verificamos imediatamente que todos os pontos sobre os eixos são pontos de estacionaridade.
Todos os pontos sobre o eixo dos ρ’s são pontos de sela por análise do sinal de g. Sobre o eixo dos
9 Enunciado e justificação rigorosa desta afirmação são algo que não pretendemos apresentar neste momento.

Veja mais à frente o problema ??.

24 de Janeiro de 2000 44
3.2. TESTES DE SEGUNDA ORDEM

x 

1 1

x+
ρ
+

=
1
ρ

1


z 1
+

1


Figura 3.6: Esta figura acompanha o exercı́cio 3.2.10. A função f exibe simetria radial relativamente ao
eixo dos x’s. No gráfico da direita indicam-se os zeros e sinais de g.

x’s a situação é mais complexa: (x, 0) é um ponto de mı́nimo se 0 < x < 1, um ponto de máximo
se x < 0 ou 1 < x, e um ponto de sela se x = 0 ou x = 1. Pontos de estacionaridade que não se
encontrem sobre os eixos deverão satisfazer
(
3(1 − x − ρ) − x = 0
2(1 − x − ρ) − ρ = 0.

Este sistema linear tem uma única solução: (1/2, 1/3), a solução no interior de T cuja existência
já tinha sido garantida e que sabemos tratar-se de um ponto de máximo.
É fácil verificar que g e consequentemente f não têm extremos absolutos.
Podemos concluir que f possui pontos de máximo local nos pontos da circunferência definida
por x = 1/2, y 2 + z 2 = 1/9 onde f vale 1/432, outros pontos de máximo local nos pontos (x, 0, 0)
com x < 0 ou x > 1 onde f vale 0, e pontos de mı́nimo local nos pontos (x, 0, 0) com 0 < x < 1
onde f vale 0. J
3.2.11

y
1 x

-1 x = y2

y= - x2

Figura 3.7: Esta figura acompanha os esboços de resolução dos Exercı́cios 3.2.11 e 3.2.12.

a) No complementar da origem f é uma função de classe C ∞ pelo que aı́ verifica-se a igualdade
∂2f ∂2f
∂x∂y = ∂y∂x . Resta-nos investigar o que se passa na origem. Como a função se anula sobre

45 24 de Janeiro de 2000
CAPÍTULO 3. EXTREMOS

os eixos coordenados decorre da definição de derivada parcial que


∂f ∂f
(0, 0) = (0, 0) = 0.
∂x ∂y

Além disso se (x, y) = / = (0, 0) temos

∂f y 5 (x2 + y 4 ) − 2x2 y 5 y 9 − x2 y 5
(x, y) = 2 = 2
∂x (x2 + y 4 ) (x2 + y 4 )
∂f 5xy 4 (x2 + y 4 ) − 4xy 8 xy 8 + 5x3 y 4
(x, y) = 2 = 2
∂y (x2 + y 4 ) (x2 + y 4 )

donde decorre usando a definição de derivada parcial

∂2f ∂2f
(0, 0) = 1 (0, 0) = 0
∂y∂x ∂x∂y

pelo que o conjunto pretendido é R2 \ {(0, 0)}.


b) Do cálculo das derivadas parciais de primeira ordem sabemos que (0, 0) é um ponto de
estacionaridade e outros pontos de estacionaridade serão soluções de
(
y 9 − x2 y 5 =0
8 3 4
xy + 5x y = 0

donde todos os pontos sobre o eixo dos x’s são pontos de estacionaridade. Outros pontos de
estacionaridade deverão satisfazer
(
y 4 − x2 =0
4 3
xy + 5x = 0.

Da primeira equação deste sistema eventuais soluções adicionais devem satisfazer y 4 = x2 .


Por substituição na segunda equação obtém-se unicamente a solução (x, y) = (0, 0). Estabe-
lecemos então que o conjunto dos pontos de estacionaridade é o eixo dos x’s. Por análise do
sinal da função na sua vizinhança verificamos que todos são pontos de sela.

c) Os extremos absolutos de f restringida a A ocorrem nalgum ponto de A pois trata-se de um


conjunto limitado e fechado. Se ocorressem em pontos interiores tais pontos seriam pontos
de extremo local o que da alı́nea anterior não acontece. Assim estudamos a restrição de f à
fronteira de A (veja a figura 3.7). Definimos g(y) = f (y 2 , y) = y 3 /2 para −1 ≤ y ≤ 0. Temos
−1/2 = g(−1) < g(y) < g(0) = 0 sempre que −1 < y < 0. Definimos h(x) = f (x, −x2 ) =
x9 0 9x8 (1+x6 )−6x14 14
+9x8
− 1+x 6 para 0 ≤ x ≤ 1. Como h (x) = −
(1+x6 )2
= − 3x
(1+x6 )2
< 0 para 0 < x < 1
temos −1/2 = h(1) < h(x) < h(0) = 0 para 0 < x < 1. As funções g e h dão-nos os valores
de f sobre a fronteira de A. Podemos concluir que −1 = f (1, −1) < f (x, y) < f (0, 0) = 0
para todo os (x, y) ∈ A \ {(0, 0), (1, −1)}.

J
3.2.12 O conjunto de zeros de f está esboçado na figura 3.2.11. Observe que (0, 0) e (1, −1) são
necessariamente √ pontos de sela e que existirá pelo menos um ponto de extremo local na região
definida por − x ≤ y ≤ −x2 . A solução do sistema de estacionaridade permite obter com efeito
que os únicos pontos de estacionaridade são (0, 0), (1/2, −1/2) e (1, −1). Por análise do sinal de f
conclui-se que (1/2, −1/2) é um ponto de mı́nimo local. A função não tem extremos absolutos. J

24 de Janeiro de 2000 46
Capı́tulo 4

Teoremas da Função Inversa e da


Função Implı́cita

Neste capı́tulo vamos estudar condições que permitem assegurar a existência da inversa de funções
de Rn → Rn , bem como condições que garantam a resolubilidade de equações da forma f (x, y) = 0
de modo a obtermos uma das variáveis em função da outra. Em casos simples conseguimos inverter
as funções ou resolver as equações explicitamente; no entanto, na maioria dos casos, tal tarefa é
complexa se não impossı́vel. Os resultados gerais que obteremos (teoremas 4.3.1 e 4.4.1) asseguram
a resolução destas questões num sentido local a precisar.

Exercı́cio 4.0.13 Convença-se da dificuldade de resolver problemas do tipo mencionado tentanto


inverter a função f : R+ × R+ → R2 definida por

f (x, y) = (xy, x2 − y 2 ).

Note que a análise deste problema pode ser feita de uma forma simples!

4.1 Invertibilidade de funções


Comecemos por recordar a definição de função injectiva

Definição 4.1.1 Diz-se que uma função f : A → B, onde A e B são conjuntos arbitrários, é
injectiva se, sempre que x 6= y (x, y ∈ A), se tenha f (x) 6= f (y).
Observe que a definição anterior é equivalente a dizer que se f (x) = f (y) então necessariamente
se verifica x = y. É também equivalente a mostrar que a equação f (x) = a, para a ∈ B, tem,
quando muito, uma solução.

Exercı́cio 4.1.1 Prove estas duas últimas afirmações.


Consideremos agora o seguinte exemplo:

Exemplo 4.1.1 Seja f : R2 → R+ × R+ a função definida por

f (x, y) = (ex , ex+y ).

Provemos que ela é injectiva. Suponhamos que f (x1 , y1 ) = f (x2 , y2 ). Então

ex1 = ex2 ex1 +y1 = ex2 +y2 .

A primeira equação implica x1 = x2 . Utilizando este resultado na segunda equação obtemos


y1 = y2 pelo que f é injectiva.

47
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

0.5

0.5 1 1.5 2

-0.5

-1

Figura 4.1: Rectas x = 1 e x + y = 1

Exercı́cio 4.1.2 Prove que a função identidade de Rn em Rn , isto é, f : Rn → Rn definida por
f (x) = x, é injectiva.
Poderı́amos ter resolvido o exemplo anterior utilizando o método gráfico que veremos de seguida:

Exemplo 4.1.2 Seja (a, b) com a, b > 0 um ponto no contradomı́nio de f . Queremos mostrar
que o sistema
ex = a e ex+y = b
só tem uma solução. Graficamente, as soluções vão ser a intersecção das rectas da forma x =
log a ≡ c e x + y = log b ≡ d. Como se pode ver na figura 4.1 (para c = d = 1) estas rectas
intersectam-se num único ponto uma vez que não são paralelas. Assim, como para cada par (a, b)
existe no máximo uma pré-imagem,1 concluı́mos que a função é injectiva.

Este exemplo sugere que é possı́vel, utilizando apenas argumentos de natureza geométrica,
verificar a injectividade de uma função. Sistematizemos este processo. Seja f uma função contı́nua,
f : R2 → R2 , com f = (f1 , f2 ). Suponhamos que queremos estudar a injectividade de f bem como
caracterizar o seu contradomı́nio.
Consideremos Ca1 , conjunto de nı́vel de f1 , definido por f1 (x, y) = a e Cb2 , definido por
f2 (x, y) = b, conjunto de nı́vel de f2 , sendo a e b reais fixos. Podemos (em princı́pio), para
cada par (a, b), desenhar estes dois conjuntos; estudando o número de pontos de intersecção destas
curvas para valores de a e b arbitrários podemos tirar conclusões importantes sobre a injectividade
e contradomı́nio de f , tal como afirma a próxima proposição (observe a figura ).

Proposição 4.1.1
Seja f : A ⊂ R2 → R2 (f = (f1 , f2 )) uma função contı́nua. Defina-se

Ca1 = {(x, y) ∈ A : f1 (x, y) = a} e Cb2 = {(x, y) ∈ A : f2 (x, y) = b} .


Então:
1. o contradomı́nio de f é o conjunto de pontos (a, b) ∈ R2 tais que Ca1 ∩ Cb2 6= ∅;
2. a função é injectiva sse para qualquer par (a, b) ∈ R2 , o conjunto Ca1 ∩ Cb2 tiver no máximo
um elemento.

Exercı́cio 4.1.3 Demonstre a proposição anterior.

Exercı́cio 4.1.4 Decida se a função f (x, y) = (x + y, x2 + y 2 ) é ou não injectiva.


Este método, sendo bastante geral para o caso de funções de R2 → R2 , não é fácil de aplicar,
pelo menos directamente, no caso mais geral de funções com mais de 2 variáveis, visto que o
desenho de superfı́cies em R3 é bastante difı́cil e em Rn , n ≥ 4, praticamente impossı́vel. No
entanto, nalguns casos particulares ainda é possı́vel utilizar ideias semelhantes, como podemos
verificar no exemplo seguinte.
1A pré-imagem de (a, b) é o conjunto de todos os pontos x do domı́nio de f tais que f (x) = (a, b).

24 de Janeiro de 2000 48
4.1. INVERTIBILIDADE DE FUNÇÕES

f |T-1

f |T

f |S-1

f |S

S
linhas de
nível de f2
linhas de
nível de f1

Figura 4.2: O método gráfico para analisar invertibilidade de aplicações de R2 em R2 e invertibilidade


local versus invertibilidade global. As curvas de nı́vel de f1 e f2 intersectam-se em dois pontos pelo que
(f1 , f2 ) não é injectiva. No entanto a restrição a S ou a T é injectiva.

Exemplo 4.1.3 Consideremos a função f : R3 → R3 definida por

f (x, y, z) = (x2 + y 2 + z 2 , x + y + z, x − y).

Mostremos que ela não é injectiva. Seja (a, b, c) um ponto no contradomı́nio de f . Podemos tomar,
por exemplo, b = c = 0 e a > 0. A equação

f (x, y, z) = (a, 0, 0)

tem como solução os pontos que estão na intersecção da esfera centrada na origem definida por

x2 + y 2 + z 2 = a

(note que esta equação define uma esfera pois a > 0) com a recta definida por

x+y+z =0 x−y =0 (4.1)

(a equação x + y + z = 0 define um plano que intersecta o plano x − y = 0 numa recta). Esta


recta, que passa pela origem ((x, y, z) = (0, 0, 0) satisfaz o sistema 4.1), intersecta qualquer esfera
centrada na origem em dois pontos distintos. Desta observação concluı́mos imediatamente que f
não pode ser injectiva.

A complexidade de exemplos como os anteriores não ocorre para transformações lineares. Nesse
caso a injectividade local garante invertibilidade global.

Exercı́cio 4.1.5 Seja T uma transformação linear de Rn em Rn . Justifique que o contradomı́nio


de T é Rn sse T é injectiva numa vizinhança de 0 sse T é invertı́vel.

49 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

A próxima proposição relaciona a injectividade com a possibilidade de invertermos uma função.

Proposição 4.1.2
Seja f uma função de A ⊂ Rn em B ⊂ Rn . Se f for injectiva, existe uma função g : f (A) ⊂ B → A
tal que (g ◦ f )(x) = x para todo o x ∈ A. A esta função g chama-se inversa de f e designa-se por
f −1 .

Nota: A função inversa terá como domı́nio a imagem por f de A, ou seja o conjunto f (A) = {y ∈
B : y = f (x), x ∈ A} e não o conjunto B a não ser que f seja sobrejectiva (isto é f (A) = B).

Exemplo 4.1.4 Vamos calcular a inversa da função f : [π, 2π] → R definida porf (x) = cos x.
Sabemos que neste intervalo a função cos é injectiva (desenhe o gráfico do coseno!). Também
sabemos que o contradomı́nio de f é o intervalo [−1, 1] pelo que a inversa será uma função f −1 :
A ⊂ [−1, 1] → [π, 2π]. A função arccos x é a inversa do coseno mas no intervalo [0, π]. É fácil
verificar que a inversa de f é dada por f −1 (y) = 2π − arccos y.

Exercı́cio 4.1.6 Calcule a inversa da função fn (x) = sen x, onde fn : [(n − 1/2)π, (n + 1/2)π] →
R.

4.1.1 Exercı́cios Suplementares


Exercı́cio 4.1.7 Diga se as seguintes funções são ou não injectivas:

1. f : {(x, y) ∈ R2 : y 6= 0} → R+ × R+ definida por f (x, y) = ex/y , x2 + y 2 .

2. f : R2 → R2 definida por f (x, y) = (xy, x2 − y 2 ).

3. f : R2 → R2 definida por f (x, y) = (x2 + 2y 2 , 2x2 + y 2 ).

4. f : R2 → R definida por f (x, y) = x2 + y 2 .

Exercı́cio 4.1.8 Mostre que a composição de funções injectivas é uma função injectiva.

Exercı́cio 4.1.9 Dê uma condição para que uma transformação linear de Rn → Rn seja injectiva.

Exercı́cio 4.1.10

1. Seja f : R → R uma função estritamente monótona. Justifique que f é injectiva.

2. Dê um exemplo de uma função monótona não injectiva.

3. Dê um exemplo de uma função não monótona injectiva.

Exercı́cio 4.1.11 Prove que uma função real de variável real monótona mas não estritamente
monótona não é injectiva.

Exercı́cio 4.1.12 Seja f : R → R, contı́nua. Prove que f é estritamente monótona sse for
injectiva. Dê um exemplo de um conjunto A ⊂ R e de uma função f : A → R contı́nua tal que f
não seja monótona mas seja injectiva.

Exercı́cio 4.1.13 Mostre que a função f (v) = √ v com v ∈ ] − 1, 1[ é injectiva e determine o


1−v 2
seu contradomı́nio.

Exercı́cio 4.1.14 Mostre que uma função real de variável real par nunca é injectiva.

24 de Janeiro de 2000 50
4.1. INVERTIBILIDADE DE FUNÇÕES

Exercı́cio 4.1.15 Mostre que uma função real de variável real diferenciável é injectiva se a sua
derivada for sempre positiva ou sempre negativa.

Exercı́cio 4.1.16 Consideremos a função f : R3 → R+ × R2 definida por

f (x, y, z) = ex+z , (x + y)3 , (x − y)5 .




Mostre que ela é injectiva.

Exercı́cio 4.1.17 Considere a função f : R3 → R3 definida por

f (x, y, z) = (4x2 + y 2 + 2z 2 , (x + y − z)2n+1 , (x − y)4n+3 )

para n ∈ N. Determine se ela é injectiva. Determine se a restrição de f a R+ × R+ × R+ é ou


não injectiva.

Exercı́cio 4.1.18 Mostre que se uma função f : Rn → Rn verificar para todos os pontos x, y

kf (x) − f (y)k ≥ ckx − ykp ,

para alguns p, c > 0 então f é injectiva.

Exercı́cio 4.1.19 Prove que a função f : {(x, y) ∈ R2 : x > 0, 0 ≤ y < 2π} → R definida por
f (x, y) = (x cos y, x sen y) é injectiva e determine a sua inversa.

4.1.2 Sugestões para os exercı́cios


4.1.7
x
1. Repare que para a, b > 0, as curvas de nı́vel definidas por = a são as rectas definidas por
y
2 2

x = ay e as curvas definidas por x + y = b são circunferências de raio b.

2. Repare que para a, b 6= 0, as curvas de nı́vel definidas por xy = a são hipérboles bem como
as definidas por x2 − y 2 = (x + y)(x − y) = b são também hipérboles.

3. Ambas as curvas de nı́vel são elipses.

4. f (1, 0) = f (0, 1). Tente descobrir geometricamente porque é que f não é injectiva.

J
4.1.8 f (g(x)) = f (g(y)) ⇒ g(x) = g(y) ⇒ x = y. J
n
4.1.9 A equação Ax = y tem solução única em R sse det A 6= 0. J
4.1.10

1. f é estritamente monótona sse x < y então f (x) < f (y) ou f (x) > f (y).

2. Por exemplo f (x) = 1 para x ∈ R.

3. Por exemplo f (x) = 1/x para x ∈ R \ {0}, f (0) = 0.

J
4.1.11 Escreva a definição de função estritamente monótona e compare com a definição de função
monótona. J
4.1.12 Recorde o que fez no exercı́cio anterior e utilize as propriedades das funções contı́nuas. J
4.1.13 A função é estritamente crescente e portanto injectiva. O seu contradomı́nio é R. J
4.1.14 Se f é par então f (x) = f (−x). J

51 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

4.1.15 Se a derivada for sempre positiva ou sempre negativa a função é monótona. J


4.1.16 Repare que a função é a composição da transformação linear (x, y, z) → (x + z, x + y, x − y)
com a função (x, y, z) → (ex , y 3 , z 5 ). Se ambas as funções forem injectivas f também será.
Alternativamente poderá aplicar o método gráfico. J
4.1.17 As soluções da equação f (x, y, z) = (a, b, c) estão sobre a intersecção de um elipsóide com
dois planos. J
p
4.1.18 Se f (x) = f (y) temos 0 ≥ kf (x) − f (y)k ≥ ckx − yk o que implica x = y. J
4.1.19 Repare que a inversa pode ter de ser escrita “por ramos” (veja o exemplo 4.1.4). J

4.2 Teorema do valor médio para funções vectoriais


Vai ser necessário, em particular ao iniciar o estudo do teorema da função inversa, estimar dis-
tâncias no contradomı́nio de uma função em termos de distâncias no domı́nio, isto é, estimar
kF (x) − F (y)k em termos de kx − yk. Para tal necessitaremos do

Lema 4.2.1 (Teorema do valor médio)


Seja F : U ⊂ Rn → Rm uma função de classe C 1 (S). Sejam x, y ∈ S e tais que o segmento de
recta que une x a y está contido em S. Então

kF (x) − F (y)k ≤ sup kDF (tx + (1 − t)y)(x − y)k.


t∈[0,1]

Ideia da demonstração. Mais uma vez recorremos ao teorema do valor médio para funções escalares
através de uma função auxiliar. Seja g(t) = (F (x) − F (y)) · F (tx + (1 − t)y). Aplique-se o teorema
do valor médio a g no intervalo [0, 1] e estime-se usando a desigualdade de Cauchy-Schwarz.
Este resultado ainda não tem a forma pretendida. Para isso introduzimos

Definição 4.2.1 (Norma de aplicações lineares e de matrizes) Seja L : Rn → Rm uma


aplicação linear. Definimos a norma de L como sendo

kLk ≡ sup kL(x)k.


kxk=1

Seja A ∈ Mm×n . Definimos a norma de A através de

kAk = kLA k.

em que LA é a aplicação linear definida canonicamente pela matriz √ A via LA (x) = Ax. Por vezes
consideraremos outras normas para matrizes reais como kAk2 = tr AT A ou kAk∞ = máxi,j |aij |
em que A = (aij )i,j=1,...,n . Continua a valer nesta situação a observação feita para normas em Rn
de que todas estas normas são equivalentes. O problema seguinte formaliza isso de alguma forma.

Problema 4.2.1 Seja E um espaço vectorial real ou complexo. Designe-se K = R ou K = C


conforme o caso. Uma função η : E → R diz-se uma norma em E se verifica as propriedades
enumeradas na definição 2.1.1 substituindo Rn ↔ E e x ∈ R ↔ x ∈ K.

1. Verifique que as normas de aplicações lineares e matrizes da definição 4.2.1 são normas
nesta acepção geral.
2. Verifique que quaisquer duas normas num espaço vectorial de dimensão finita são equivalen-
tes (adapte o enunciado e solução do exercı́cio 2.1.13).
3. Quais são as melhores contantes na equivalência entre as normas de matrizes mencionadas
na definição 4.2.1?

24 de Janeiro de 2000 52
4.3. TEOREMA DA FUNÇÃO INVERSA

Corolário 4.2.2
Sob as mesmas hipóteses do lema 4.2.1 vale

kF (x) − F (y)k ≤ máx kDF (tx + (1 − t)y)kkx − yk. (4.2)


t∈[0,1]

Mais geralmente se F ∈ C 1 (K), com K um conjunto limitado, fechado e convexo2 , então para
todos os x, y ∈ K temos

|F (x) − F (y)| ≤ máx kDF (tx + (1 − t)y)kkx − yk.


t∈[0,1]

Ambos os máximos atrás referidos são finitos (porquê?).

Problema 4.2.2 Convém notar que não existe uma versão do teorema do valor médio para fun-
ções vectoriais análoga à conhecida para funções escalares e que envolva uma igualdade da forma
f (b) − f (a) = Df (a + θ(b − a))(b − a). Com efeito, pode verificar que para a função g : R → R2
definida por g(t) = (cos t, sen t) não existe θ ∈ ]0, 2π[ tal que g(2π) − g(0) = Dg(θ)(2π) embora a
desigualdade 4.2.

Problema 4.2.3 Seja A ∈ Mn×n e LA a aplicação linear definida canonicamente por A como
definido anteriormente. Obtenha uma expressão para o valor de kLA k em termos dos valores
próprios de AT A.

4.3 Teorema da Função Inversa


Em primeira aproximação o teorema da função inversa diz respeito à resolução de sistemas de
equações não lineares da forma
F (x) = y (4.3)
em que x, y ∈ Rn . Pretende-se obter, sob condições apropriadas, a garantia de existência de uma
função que nos dê x em função de y satisfazendo a equação, avaliar da regularidade de tal função
e relacionar a derivada da inversa com a derivada de F . Tais objectivos só são exequı́veis sob
condições particulares e desde que entendamos a existência de inversa num sentido local, isto é,
dado um ponto x0 no domı́nio de F estabelece-se a existência de vizinhanças V de x0 e W de
F (x0 ) e de uma função G : W → V tal que para todo o x ∈ V temos G(F (x)) = x. Nota-se que
são casos particulares já conhecidos os seguintes:

Exemplo 4.3.1 (Caso linear) Suponha-se que A ∈ M, em que M designa as matrizes reais
n × n, e b ∈ Rn . Considere-se
F (x) ≡ Ax + b.
Então o sistema (4.3) é solúvel se e só se det A 6= 0 e nesse caso podemos obter explicitamente

x = A−1 (y − b) ≡ F −1 (y).

Note-se que neste caso DF = A, F −1 é diferenciável e (DF )−1 = A−1 .

Exemplo 4.3.2 (Dimensão 1) Seja f : ]a, b[ → R, f ∈ C 1 (]a, b[) , a < x0 < b, y0 ≡ f (x0 ),
f 0 (x0 ) 6= 0. Então f 0 mantém o seu sinal numa vizinhança V de x0 e consequentemente f é
estritamente monótona em V . Assim a restrição de f a V , f |V , é invertı́vel, diferenciável e se
−1 −1
g ≡ (f |V ) temos g 0 (y0 ) = [f 0 (x0 )] .
Nesta situação podemos abdicar de alguma regularidade de f , supondo f unicamente diferen-
ciável em vez de C 1 desde que suponhamos que f 0 mantém o seu sinal num intervalo J contendo
x0 . Podemos então concluir que f é invertı́vel em J.
2 Um subconjunto de um espaço vectorial diz-se convexo se contém qualquer segmento de recta definido por um

par dos seus pontos.

53 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

A segunda parte do exemplo anterior deve ser contrastado com

Problema 4.3.1 Considere a aplicação3 R2 3 (x, y) 7→ (ex cos y, ex sen y). Verifique que o deter-
minante da matriz jacobiana desta função mantém o sinal em R2 e no entanto a função não é
invertı́vel. No entanto, dado um ponto existe uma vizinhança tal que a restrição da função a essa
vizinhança é invertı́vel.

Basta ter em conta o caso linear descrito no exemplo 4.3.1 para constatar que a generalização
do teorema da função inversa que procuramos não terá entre as suas hipóteses DF (x0 ) 6= 0 por
esta hipótese não ser suficiente para garantir invertibilidade. O caso linear sugere fortemente que
uma hipótese a considerar seja DF (x0 ) invertı́vel e, de facto, assim é. Uma forte sugestão de que
assim será decorre também do seguinte problema

Problema 4.3.2 Considere uma função F definida num aberto, diferenciável e que possui inversa
diferenciável.

a) Verifique a relação (DF )−1 = D(F −1 ).

b) Verifique que se F ∈ C 1 então F −1 ∈ C 1 .

A importância do teorema da função inversa vai decorrer não só do resultado em si mas também
dos métodos a aplicar na demonstração serem susceptı́veis de generalização a outras áreas de
Matemática4 . Por isso vamos dedicar algum tempo a motivar e descrever as principais ideias da
sua demonstração. No entanto, antes de iniciar a discussão do teorema propriamente dito convém
notar algus factos elementares.
A ideia base consiste na construção da inversa local através dum limite de aproximações su-
cessivas sendo cada aproximação construı́da através da resolução dum problema linear em que um
dos dados é o termo anterior da sucessão. Designaremos tal sucessão por (xi )i∈N e a aplicação
que associa a cada termo da sucessão o termo seguinte por Ty , isto é Ty (xi−1 ) = xi para i ∈ N.
O domı́nio de Ty será uma vizinhança V de x0 e y ∈ W uma vizinhança de y0 ≡ F (x0 ). Tais
vizinhanças serão escolhidas suficientemente pequenas de maneira a aı́ se verificarem condições que
garantam a convergência da sucessão (xi )i∈N . Existem pelo menos duas hipóteses naturais para
a escolha de Ty via a substituição de F por uma sua aproximação linear e resolução do sistema
linear correspondente:
−1
Ty (x) = x + DF (x) (y − F (x)) (4.4)
ou
−1
Ty (x) = x + DF (x0 ) (y − F (x)). (4.5)
O significado de cada uma destas duas escolhas é ilustrado para o caso unidimensional na figura 4.3.
Embora a primeira possa parecer mais natural a segunda tem a vantagem de não ser necessário ter
de controlar a variação da derivada DF (x) o que permitirá alguma simplificação do argumento 5 .
Consideramos então que Ty está definida por (4.5) com x e y em vizinhanças a especificar de x0
e y0 .
Convencionamos que Ty0 ≡ Ty e Tyk ≡ Ty ◦ Tyk−1 . Pretendemos provar que a inversa local, G,
é dada por
G(y) = lim Tyk (x0 ). (4.6)
k→∞

Exercı́cio 4.3.1 Experimente aplicar o algoritmo descrito ao problema de determinar zeros de


f (x) = x − x2 começando com x0 = 1/2. E com x0 = 4?
3 Verificaremos mais tarde que se identificarmos R2 a C da maneira habitual esta aplicação é simplesmente

C 3 z 7→ ez .
4 Para a maioria dos alunos tais exemplos serão encontrados ao estudar Análise Numérica e Equações Diferenciais

Ordinárias.
5 A opção pela segunda hipótese é também natural do ponto de vista do método numérico, conhecido por método

de Newton, a que corresponde, pois evita recalcular e inverter uma matriz em cada iteração

24 de Janeiro de 2000 54
4.3. TEOREMA DA FUNÇÃO INVERSA

y0 

y0

y 

x2 x1 x0 x2 x1 x0

Figura 4.3: Duas hipóteses para a determinação de raı́zes de uma equação não linear por iterações
sucessivas.

Claro que uma hipótese necessária para que estas ideias funcionem será exigir que DF (x0 ) seja
invertı́vel ou de forma equivalente que o determinante da matriz jacobiana em x0 seja não nulo.
Primeiro verificaremos que o limite em 4.6 existe e só depois que o limite é a solução pretendida.
Finalmente verificar-se-á a regularidade da inversa local construı́da.
Resumindo, os passos essenciais da demonstração do teorema da função inversa são:

1. Mostrar que a sucessão de aproximações sucessivas (xk )k∈N é convergente.

2. Mostrar que o limite da sucessão define uma inversa local.

3. Mostrar que a inversa local é de classe C 1 .

Comecemos então por tentar provar que a sucesssão de aproximações sucessivas é convergente.
Tal será feito à custa de um desenvolvimento “telescópico” dos termos da sucessão da seguinte
forma
Xi
xi = x0 + (xj − xj−1 ).
j=1

Tal
P permite reduzir o estudo da convergência da sucessão ao estudo da convergência da série
xj − xj−1 . Para isso iremos utilizar
P+∞ P+∞
Problema 4.3.3 Seja k=1 xk uma série de termo geral em Rn . Prove que se a série k=1 kxk k
é convergente em R então a série é convergente6 .
P
Para provar a convergência da série j kxj −xj−1 k tentaremos estabelecer condições que garantem
que o seu termo geral é majorado pelo de uma série geométrica convergente. Isto equivale a exigir
que
kxj+1 − xj k ≤ ρkxj − xj−1 k
para alguma constante ρ, com 0 ≤ ρ < 1. Ora

xj+1 − xj = Ty (xj ) − Ty (xj−1 )

pelo que tal objectivo estará garantido se a aplicação Ty verificar para todo o x, z ∈ V e todo o
y∈W
kTy (x) − Ty (z)k ≤ ρkx − zk. (4.7)
6 Nestas condições diz-se que a série é absolutamente convergente.

55 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

U
f W
V 

y0


x0
–1
(f|V )

Figura 4.4: Algumas das convenções na demonstração do teorema da função inversa.

Com efeito

kTy (x) − Ty (z)k = kx − z − DF (x0 )−1 (F (x) − F (z))k


= kDF (x0 )−1 (F (x) − F (z) − DF (x0 )(x − z))k
≤ M k(F (x) − F (z) − DF (x0 )(x − z))k
≤ M αkx − zk,

em que M = kDF (x0 )−1 k e na última passagem usou-se o teorema do valor médio aplicado à
função H(x) = F (x) − DF (x0 )(x − x0 ) sendo α = supx∈V kDH(x)k e exigindo que V seja
convexa (uma bola). Notando que DH(x0 ) = 0 e usando a continuidade das derivadas parciais de
F , concluı́mos que podemos fazer M α < 1 desde que V seja suficientemente pequena (uma bola
com raio suficientemente pequeno B (x0 )).
Provamos agora que os termos das sucessões e os seus limites pertencem à vizinhança V de
x0 desde que W e V sejam escolhidas suficientemente pequenas. Isto completará a justificação da
convergência da sucessão de aproximações sucessivas. Para isso estimamos

kTy (x) − x0 k = kx − x0 + DF (x0 )−1 (y − F (x0 ) + F (x0 ) − F (x))k


≤ kDF (x0 )−1 (y − F (x0 ))k + kx − x0 + DF (x0 )−1 (F (x0 ) − F (x))k
≤ M ky − F (x0 )k + M k(F (x0 ) − F (x)) − DF (x0 )(x0 − x)k
≤ M ky − F (x0 )k + M αkx0 − xk

de oonde podemos concluir que, se escolhermos  > 0 de maneira a que kx0 −xk <  garanta M α <
1/3, podemos escolher também ky−F (x0 )k < r de maneira a M r < /3, donde kTy (x)−x0 k < 23 .
Logo todos os termos das sucessões e os seus limites estarão em B 23  (x0 ) ⊂ B (x0 ) ≡ V .
Notamos também que G(y) satisfaz F (G(y)) = y se Ty (G(y)) = G(y). Esta última igualdade
decorre da continuidade de Ty que por sua vez decorre da desigualdade (4.7). Assim G satisfaz
F (G(y)) = y.
Ainda não provámos que numa vizinhança suficientemente pequena de x0 a função F é injectiva.
A não injectividade corresponderia à existência de x, z, x 6= z tais que F (x) = F (z) = y. Terı́amos
então também Ty (x) = Ty (z). Assim kx − zk = kTy (x) − Ty (z)k ≤ ρkx − zk com 0 < ρ < 1, para
x, z ∈ B (x0 ), o que é impossı́vel a não ser que x = z.
Resta agora estabelecer propriedades da inversa local. Note-se que, se estabelecermos que
a inversa local é diferenciável com derivada dada por DG(F (x)) = (DF (x))−1 , a continuidade
de DF mais a fórmula explı́tica para a matriz jacobiana de G estabelecem que DG ∈ C 17 . A
7 De forma análoga se F ∈ C k então G ∈ C k com k ≥ 2 ou k = ∞

24 de Janeiro de 2000 56
4.3. TEOREMA DA FUNÇÃO INVERSA

unicidade local da inversa permite limitarmo-nos a analisar a diferenciabilidade em y0 = F (x0 ).


Para tal, convencionando F (x) = y e x 6= x0 , considera-se
E ≡ kG(y) − G(y0 ) − DF (x0 )−1 (y − y0 )k
= kx − x0 − DF (x0 )−1 (F (x) − F (x0 ))k
= kx − x0 − DF (x0 )−1 (DF (x0 )(x − x0 ) + o(kx − x0 k))k
= k − DF (x0 )−1 (o(kx − x0 k))k
≤ kDF (x0 )−1 kko(kx − x0 k)k.
Demonstrar a diferenciabilidade de G em y0 com derivada DF (x0 )−1 corresponde a mostrar que
E/ky − y0 k → 0 quando y → y0 o que a desigualdade anterior permite reduzir a mostrar que
kx−x0 k
ky−y0 k é limitado para x numa vizinhança de x0 e que G é contı́nua em x0 (o que garante que
E/kx − x0 k → 0 quando y → y0 ). Quanto à primeira destas questões observamos que
kx − x0 k kx − x0 k 1
= ≤
ky − y0 k kDF (x0 )(x − x0 ) + o(kx − x0 k)k 2kDF (x0 )k−1
ko(kx−x0 k)k
em que no último passo escolheu-se x numa vizinhança de x0 de forma a termos kx−x0 k ≤
1 kAxk 1
2kDF (x0 )k−1 eusou-se a estimativa ≥ x k válida para um operador linear não singular
kA−1 k
n n
A : R → R (demonstre-a!). Quanto à continuidade de G em y0 deixamos ao cuidado do leitor
estabelecer que estimativas já obtidas permitem afirmar que dado  > 0 existem  com 0 <  < 
e r > 0 tais que ky − y0 k < r e kx − x0 k <  implicam kTy (x) − x0 k < . Consequentemente,
por indução obtém-se que kTyk (x0 ) − x0 k <  para todo o k ∈ N e por passagem ao limite
kG(y) − G(y0 )k < .
Provou-se assim:
Teorema 4.3.1 (Função Inversa)
Seja F : U ⊂ Rn → Rn uma função de classe C 1 (U ) em que U é um aberto e seja x0 ∈ U tal que
DF (x0 ) é não singular, isto é,
det DF (x0 ) 6= 0.
Então
i) existem vizinhanças V de x0 e W de F (x0 ) tais que F é uma bijecção de V sobre W e portanto
−1
F|V : W → V está bem definida;
−1
ii) G = F|V ∈ C 1 (W );
−1
iii) a derivada da função G = F|V no ponto y = f (x) verifica

D(G)(y) = (DF (x))−1 ,


para todo o x ∈ V ou todo o y ∈ W . Adicionalmente se F ∈ C k (U ) com k ∈ N ou k = ∞
então G ∈ C k (W ).
Convém acentuar que o teorema da função inversa não garante invertibilidade global e não é
susceptı́vel de ser melhorado nesse sentido devido a exemplos como o do problema 4.3.1.

Exemplo 4.3.3 Consideremos a função f : R2 \ {(0, 0)} → R2 definida por


f (x, y) = xy, y 2 − x2 .


O seu jacobiano8 é dado por


" #
∂f1 ∂f1  
y x
det ∂x
∂f2
∂y
∂f2 = det = 2(x2 + y 2 ).
∂x ∂y
−2x 2y
8 Jacobiano é uma abreviatura de determinante da matriz jacobiana.

57 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

Como este valor é sempre positivo (notemos que a origem foi excluı́da do domı́nio), o teorema da
função inversa garante a invertibilidade local desta função. No entanto f (1, 1) = f (−1, −1) e logo
a função não pode ser globalmente invertı́vel por não ser injectiva.

Exercı́cio 4.3.2 Seja f : R2 \ {(0, 0)} → R2 definida por

f (x, y) = (xy, y 6 − x6 )

Mostre que f é localmente injectiva mas não globalmente injectiva.

Exercı́cio 4.3.3 Mostre que f : R → R2 definida por f (θ) = (cos θ, sen θ) é localmente mas não
globalmente injectiva ( não utilize o teorema da função inversa para provar injectividade local mas
sim um raciocı́nio ad hoc).
O teorema da função inversa não só garante, em determinadas condições, a existência da inversa
de uma função f , como também permite calcular, graças à garantia de diferenciabilidade numa
vizinhança, todas as derivadas de f −1 até à ordem m, o grau de diferenciabilidade de f . O exemplo
seguinte ilustra este facto:

Exemplo 4.3.4 Seja f (x) = x + x2 . O teorema da função inversa garante que f é invertı́vel
numa vizinhança de x = 0. Seja g a inversa de f . Então temos g(0) = 0 e

f (g(y)) = g(y) + g(y)2 = y.

Diferenciando a identidade anterior obtemos


∂g ∂g
(y) + 2g(y) (y) = 1. (4.8)
∂y ∂y
Portanto em y = 0 temos
∂g
(0) = 1.
∂y
Diferenciando a identidade 4.8 obtemos

∂2g ∂g ∂2g
2
(y) + 2 (y)2 2g(y) 2 (y) = 0
∂y ∂y ∂y
de onde se tira
∂2g
(0) = −2.
∂y 2

Exercı́cio 4.3.4 Calcule a inversa da função f (x) = x + x2 e confirme o resultado do exemplo


anterior.

Exemplo 4.3.5 Seja f : R → R uma função C ∞ . Se f 0 (x) 6= 0, então é possı́vel calcular todas
as derivadas de f −1 no ponto y = f (x) usando o método seguinte:
Consideremos a identidade
f f −1 (y) = y.


Derivando ambos os membros da expressão anterior obtemos, pela regra da derivação da função
composta,
∂f −1  ∂f −1
f (y) (y) = 1. (4.9)
∂x ∂y
Da equação anterior obtemos
∂f −1 1
(y) = ∂f
.
∂y ∂x (f −1 (y))

24 de Janeiro de 2000 58
4.3. TEOREMA DA FUNÇÃO INVERSA

∂ 2 f −1
Para o cálculo de ∂y 2 (y) derivamos novamente (4.9), obtendo
2
∂ 2 f −1  ∂f −1 ∂f −1 2 ∂ 2 f −1

f (y) (y) + f (y) + (y) = 0,
∂x2 ∂y ∂x ∂y 2

de onde concluı́mos
∂2f
  −1 2
∂ 2 f −1 ∂x2 f
−1
(y) ∂f∂y (y)
(y) = − 2 .
∂y 2 ∂f
(f −1 (y))
∂x

Assim, calculando sucessivamente as diversas derivadas de f −1 podemos desenvolver esta função


em fórmula de Taylor em torno do ponto y e portanto, numa vizinhança suficientemente pequena,
aproximá-la com precisão arbitrária.

Exercı́cio 4.3.5 Utilizando as ideias do exemplo anterior calcule

∂ 3 f −1
(y).
∂y 3

Aplicando o exemplo anterior a uma função podemos obter a fórmula de Taylor de f −1 (y) em
torno de um ponto

Exercı́cio 4.3.6 Seja f (x) = x + ex .

1. Prove que f é injectiva e portanto a inversa f −1 existe.

2. Calcule o desenvolvimento de Taylor de f −1 (y), em torno de y = f (0) = 1 até à terceira


ordem.

Para o cálculo de primeiras derivadas da inversa de uma função o teorema da função inversa
dá-nos uma expressão explı́cita, que pode ser aplicada directamente.

Exemplo 4.3.6 Seja f : R2 → R2 a função dada por

f (x, y) = x + y + x3 y − xy + 1, x − y + x4 ch y .


Sabemos que f (0, 0) = (1, 0). Podemos facilmente provar que a função f admite inversa local
definida numa vizinhança do ponto (1, 0), sendo f −1 (1, 0) = (0, 0). De facto temos

1 + 3x2 y − y 1 + x3 − x
 
Jf = .
1 + 4x3 ch y −1 + x4 sh y

No ponto (x, y) = (0, 0) obtemos  


1 1
Df (0, 0) = .
1 −1
Assim, como det Df = −2 6= 0 e a função é de classe C ∞ existe inversa f −1 = (f1−1 , f2−1 ) também
C ∞ numa vizinhança de (u, v) = (1, 0) e verificando
" −1
∂f1−1
# −1 
∂f1  
−1 ∂u ∂v 1 1 1/2 1/2
Df (1, 0) = ∂f −1 ∂f −1 = = .

2 2 1 −1 1/2 −1/2
∂u ∂v (u,v)=(1,0)

Podemos também aplicar ideias semelhantes às do exemplo (4.3.5) para funções de Rn em Rn .
Utilizando um procedimento análogo, resolva então o seguinte exercı́cio:

∂ 2 f −1

Exercı́cio 4.3.7 Determine ∂u2 (u, v) com (u, v) = f (x, y) = xy, x2 − y 2 .

59 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

Com o teorema da função inversa também podemos dar uma condição de injectividade local
sobre funções de Rn → Rm , com m ≥ n, como se pode verificar no exemplo seguinte:

Exemplo 4.3.7 Se car[Df ] = n (isto é a caracterı́stica de Df ou seja o número de linhas ou


colunas linearmente independentes de Df for n) então a função f é localmente injectiva.
Seja f : Rn → Rm , com f (x) = (f1 (x), . . . , fm (x). Se car[Df ] = n no ponto x0 então existem
ı́ndices i1 , . . . , in tais que a matriz
 ∂f ∂f

i1
∂x1 . . . ∂xin1
 . .. 
 .
 . . .

∂fin ∂fin
∂x1 . . . ∂xn

tem determinante não nulo. Então, pelo teorema da função inversa a função g(x) = (fi1 , . . . , fin )
é localmente injectiva, pelo que f também será localmente injectiva.

Exercı́cio 4.3.8 Mostre, usando o exemplo anterior, que a aplicação R 3 x 7→ (sen x, cos x) é
localmente injectiva.

4.3.1 Exercı́cios Suplementares


Exercı́cio 4.3.9 Considere o sistema de equações
(
u = xy + sen(x + y),
v = e−x+y−2 + xy .

Mostre que existem vizinhanças de (u, v) = (−1, 0) e de (x, y) = (−1, 1) tais que o sistema define
(x, y) como uma função C 1 de (u, v) desde que as variáveis estejam nessas vizinhanças. Calcule
∂x
∂u (−1, 0).

Exercı́cio 4.3.10 Considere o sistema de equações não lineares


(
u = x2 y 3 + sen(x + y) − 1,
v = sen(xy) + x − y + 1.

a) Mostre que existem vizinhanças de (x, y) = (0, 0) e de (u, v) = (−1, 1) tais que aquele sistema
define (x, y) como uma função C ∞ de (u, v) em tais vizinhanças.

b) Calcule a matriz jacobiana da função cuja existência garantiu na alı́nea anterior no ponto
(−1, 1).

Exercı́cio 4.3.11 Considere a função real de variável real definida por f (x) = cos x.

1. Qual a maior vizinhança V do ponto −π/4 tal que f|V é injectiva? Calcule a inversa de f
em V .

2. Existe alguma vizinhança de π na qual a função f seja injectiva?


−1 −1 π
3. Calcule uma inversa local de f , fπ/2 , tal que fπ/2 (0) = 2.

−1 −1 3π
4. Calcule uma inversa local de f , f3π/2 , tal que f3π/2 (0) = 2 .

Exercı́cio 4.3.12 Mostre que a função f : R2 \ {(0, 0)} → R2 \ {(0, 0)} é localmente mas não
globalmente injectiva
f (x, y) = (xy, 2x2 − 5y 2 ).

24 de Janeiro de 2000 60
4.3. TEOREMA DA FUNÇÃO INVERSA

0.5

-2 2 4 6

-0.5

-1

Figura 4.5: Gráfico do coseno

Exercı́cio 4.3.13 Mostre que a função f : R3 → R3 , definida por

f (x, y, z) = (sen(x + y), sen(x − y), z 3 − z 5 ),

é localmente injectiva em torno (0, 0, 0) mas que não é globalmente injectiva.

Exercı́cio 4.3.14 Considere o sistema de equações


(
u = xy + sen(x + y),
v = e−x+y−2 + xy .

Mostre que existem vizinhanças de (u, v) = (−1, 0) e de (x, y) = (−1, 1) tais que o sistema define
(x, y) como uma função C 1 de (u, v) desde que as variáveis estejam nessas vizinhanças. Calcule
∂x
∂u (−1, 0).

Exercı́cio 4.3.15 Seja f : A → Rn uma função de classe C 1 , onde A é um conjunto aberto.


Prove que para cada conjunto compacto C, C ⊂ A onde Jf 6= 0 existe um número finito de
conjuntos abertos Ui tais que C ⊂ ∪Ui e f é invertı́vel em cada Ui . Sugestão: Utilize o teorema
de Heine-Borel.

Exercı́cio 4.3.16 Considere a função

f (x, y) = (sen x arccotg y, cos x arccotg y).

Prove que

1. Jf (x, y) 6= 0 para todo o x e y.

2. f não é injectiva.

4.3.2 Sugestões para os exercı́cios


4.3.11

1. Observe a figura 4.5 e repare que a restrição da função cos x ao intervalo [−π, 0] é injectiva.

2. Utilize a figura 4.5.

3. Uma inversa possı́vel será arccos x, para x ∈ [−1, 1].

4. Uma inversa nas condições requeridas é 2π − arccos x, para x ∈ [−1, 1].

61 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

J
4.3.12 Temos  
y x
Df =
4x −10y
e portanto det Df = −10y 2 − 4x2 6= 0 para x, y 6= 0. Deste modo o teorema da função inversa
garante a injectividade local de f . Temos também que f (1, 1) = f (−1, −1) pelo que f não é
injectiva. J
4.3.13 Repare que a função (sen(x + y), sen(x − y)) é localmente injectiva numa vizinhança da
origem. é também fácil verificar que numa vizinhança de z = 0 a função z 3 − z 5 é injectiva.
Com estes resultados é fácil provar que f é localmente injectiva em torno da origem. f (x, y, 0) =
f (x, y, 1), pelo que f não pode ser injectiva. J
−x+y−2 x
4.3.14 Definindo f (x, y) = (xy + sen(x + y), e + y ), temos
 
2 0
Df (−1, 0) = .
0 2

Como o determinante desta matriz é não nulo a função é localmente invertı́vel e


 
−1 1/2 0
Df (−1, 1) = .
0 1/2

J
4.3.15 Como o jacobiano não se anula, para cada ponto existe uma vizinhaça Ux onde a função
é invertı́vel. O conjunto de todas estas vizinhanças é uma cobertura de C. Como este conjunto é
compacto podemos extrair uma subcobertura finita (pelo teorema de Heine-Borel). J
4.3.16 O primeiro resultado obtem-se pelo método usual, sendo o jacobiano dado por
arccotg y
Jf = − ,
1 + y2
que nunca se anula. Note que a função arccotg não está definida na origem. J

4.4 Teorema da Função Implı́cita


Frequentemente necessitamos de resolver equações na forma

f (x, y) = 0,

em ordem a x ou y. Porém, mesmo para expressões simples, esta tarefa pode ser extremamente
difı́cil. Para se convencer disto. . .

Exercı́cio 4.4.1 Tente resolver a equação

y + sen y − x = 0 (4.10)

de modo a obter y em função de x. Aparentemente não existe solução explı́cita elementar mas
nunca se sabe. . .
No entanto, conhecemos uma solução da equação 4.10, nomeadamente y = x = 0. Para além
disso numa vizinhança da origem, a função x = y + sen y tem inversa pois é injectiva. Portanto,
aplicando o teorema da função inversa, poderı́amos mostrar a existência de uma função y(x) tal
que y(x) + sen(y(x)) − x = 0.

Exercı́cio 4.4.2 Confirme as afirmações anteriores.

24 de Janeiro de 2000 62
4.4. TEOREMA DA FUNÇÃO IMPLÍCITA

y
A y= 1 - x2


- 1 - x2


y= 

y= - 1 - x2 

Figura 4.6: A porção da circunferência x2 + y 2 − 1 = 0 ampliada em A não é um gráfico de uma função


da forma y = g(x). O mesmo acontece com a intersecção da circunferência com uma qualquer vizinhança
de (1, 0).

Nesta secção estudaremos um teorema que nos dá condições suficientes para se poder resolver
equações f (x, y) = 0, uma vez conhecidos pontos x0 e y0 para os quais f (x0 , y0 ) = 0 e que é
conhecido por teorema da função implı́cita. Este teorema é um resultado intimamente ligado ao
teorema da função inversa. De facto são equivalentes e o estabelecer essa equivalência é relativa-
mente fácil embora mostrar que o teorema da função implı́cita é uma consequência do teorema da
função inversa possa parecer, numa primeira análise, pouco natural.
Comecemos por algumas observações ainda não inteiramente precisas para estabelecer um
primeiro paralelismo entre os dois resultados. De um ponto de vista de solução de equações não
lineares, o teorema da função inversa lida, como vimos, com a solução local de equações da forma
y = F (x) em ordem a x, em que F ∈ C 1 e uma certa aplicação linear (a derivada de F ) é não
singular num ponto x0 em torno do qual a invertibilidade local é assegurada. De forma análoga, o
teorema da função implı́cita lida com a solução local de equações da forma F (x, y) = 0 em ordem
a y, em que F ∈ C 1 e uma certa aplicação linear relacionada com a derivada de F é não singular
num ponto (x0 , y0 ) em torno do qual a resolubilidade fica assegurada. Começamos por ilustrar
um tal problema numa situação em que se pode explicitamente chegar às mesmas conclusões e as
dimensões dos espaços envolvidos são as mais baixas possı́veis.

Exemplo 4.4.1 (Caso particular em dimensão 2) Considere-se a equação da circunferência


x2 + y 2 − 1 = 0. Na vizinhança de que pontos em que é verificada é que esta equação define
y como função de x? Resolvendo a equação em ordem a y, ou melhor ainda esboçando o seu
gráfico (ver a fig. 4.6), facilmente se reconhece que qualquer que seja o ponto sobre o gráfico desta
circunferência, excepto os pontos (−1, 0) e (1, 0), é possı́vel escolher uma vizinhança suficiente

2
√ ponto cuja intersecção com o conjunto definido pela equação verifica y = 1 − x
pequena desse
2
ou y = − 1 − x . É o que se ilustra na fig. 4.6 em B. Por outro lado numa vizinhança de um
dos dois pontos excepcionais tal é sempre impossı́vel, é o que se ilustra na fig. 4.6 em A.
O carácter excepcional dos pontos (1, 0) e (−1, 0) obviamente tem a ver com o facto da tangente
à circunferência nestes pontos ser vertical ou, se recordarmos que o gradiente de uma campo

63 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

escalar é ortogonal às suas linhas de nı́vel, com o facto de designando f (x, y) = x2 + y 2 − 1 temos
∂f ∂f
∂y (1, 0) = ∂y (−1, 0) = 0.

Uma outra fonte de inspiração para compreender este tipo de problemas é a álgebra linear.

Exemplo 4.4.2 (Caso linear) Seja T uma transformação linear de Rm+n em Rm , com n, m ≥
1. Suponhamos que T (x) = Ax onde A é uma matriz m × (m + n). Se car A = m (recorde que
a caracterı́stica de A, car A, é o número de linhas ou colunas linearmente independentes) então a
equação T (x) = 0 permite definir m coordenadas de x em função das restantes n.
Observemos agora alguns factos. Primeiro, temos T (0) = 0. Segundo, se car A = m então
existem m colunas linearmente independentes. Podemos, sem perda de generalidade, supor que são
as m primeiras (se isto não fosse verdade seria sempre possı́vel permutar as colunas da matriz,
fazendo uma mudança de variáveis). A matriz A pode ser escrita como
 
a11 . . . a1m . . . a1 m+n
A =  ... .. ..
.
 
. .
am1 ... amm ... am m+n

A derivada de T em ordem às primeiras m variáveis, (x1 , . . . , xm ), é representada pela matriz


 
a11 . . . a1m
à =  ... .. 

. 
am1 . . . amm

e det à 6= 0. Note que é o facto de à ter determinante não nulo que permite determinar as
primeiras m coordenadas em função das n − m restantes.

Exercı́cio 4.4.3 Resolva o sistema


 
  x  
1 1 −1   0
y =
1 1 1 0
z

de modo a obter x e z como função de y.


O teorema da função implı́cita, que enunciamos de seguida, generaliza (de um forma bastante
poderosa) o exemplo anterior. Vai ser conveniente no seu enunciado e para cálculos posteriores
∂(f ,f ,...,f )
introduzir a notação ∂(xji1 ,xji2 ,...,xjik ) , com 1 ≤ j1 < j2 < · · · < jk ≤ m, 1 ≤ i1 < i2 < · · · < ik ≤ n,
1 2 l
para representar a derivada de uma função que se obtém de uma função dada f : A ⊂ Rn → Rm
só considerando k das suas componentes fj1 , fj2 , . . . , fjk e fixando n − l das suas variáveis, ou
seja considerando-a só como função de l variáveis xi1 , xi2 , . . . , xil . Tal derivada é representada
pela submatriz da matriz jacobiana correspondente a considerar as colunas de ı́ndices i1 , i2 , . . . , ik
e as linhas de ı́ndices j1 , j2 , . . . , jk a que também nos referiremos usando a mesma notação. No
exemplo 4.4.2 podı́amos ter escrito à = ∂(x1∂T ,...,xn ) .

Teorema 4.4.1 (Função Implı́cita)


Seja f : U ⊂ Rn × Rm → Rm uma função de classe C p (int U ). Suponha-se que, no ponto
(x0 , y0 ) ∈ int U (x0 ∈ Rn e y0 ∈ Rm ) verifica-se f (x0 , y0 ) = 0 e

∂f
det (x0 , y0 ) 6= 0.
∂y
Então, existe uma vizinhança V de x0 na qual a equação

f (x, y) = 0

24 de Janeiro de 2000 64
4.4. TEOREMA DA FUNÇÃO IMPLÍCITA

y v=f(x,y)


f(x,y) = 0

F -1

x x

F(x,y) = (x,f(x,y))

Figura 4.7: Na demonstração do teorema da função implı́cita pelo processo sugerido note que a função
é construı́da pela composição das funções x 7→ (x, 0), F −1 e (x, y) 7→ y por esta ordem. Claro que F −1
designa uma inversa local.

define uma única função g ∈ C p (V ), g : V ⊂ Rn → Rm , para a qual

f (x, g(x)) = 0

para todo o x ∈ V . Adicionalmente, a derivada de g em V satisfaz


 −1
∂f ∂f
Dg(x) = − (x, g(x)) (x, g(x)). (4.11)
∂y ∂x

Notemos que o resultado do teorema é local, ao contrário do exemplo 4.4.2 que é global, isto
é se car A = m, podemos sempre resolver a equação Ax = 0 em ordem a m coordenadas. No
entanto, isto só é válido porque o sistema naquele exemplo é linear. Em geral não temos nenhuma
garantia de que possamos resolver uma equação da forma F (x, y) = 0 em ordem, por exemplo,
a y, para qualquer valor de x, mesmo que num dado ponto sejam verificadas as condições do
teorema da função implı́cita (o teorema apenas garante a existência de soluções na vizinhança do
ponto).
O teorema da função implı́cita pode ser demonstrado de uma forma análoga à do teorema
da função inversa por linearização e aproximações sucessivas. É, no entanto, muito mais simples
demonstrá-lo à custa do teorema da função inversa.

Problema 4.4.1 Demonstre o teorema da função implı́cita. Para tal, usando as convenções
do enunciado do teorema, considere a aplicação F : U ⊂ Rn × Rm → Rn × Rm definida por
F (x, y) = (x, f (x, y)) e aplique-lhe o teorema da função inversa relativamente ao ponto (x0 , y0 ).

Exemplo 4.4.3 Consideremos a equação f (x, y) = x2 + y + sen(x2 + y 2 ) = 0. Então como


f (0, 0) = 0 e ∂f
∂y (0, 0) = 1 6= 0, existe uma função g(x), definida para |x| suficientemente pequeno
tal que f (x, g(x)) = 0. Para além disto temos
∂f
∂g ∂x (0, 0)
(0) = − ∂f = 0.
∂x ∂y (0, 0)

Exemplo 4.4.4 Consideremos o sistema


(
x + y + xyz = 0,
x − y + xz + yz = 0.

65 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

Vamos agora estudar a existência de funções X(z) e Y (z) tais que X(0) = Y (0) = 0 e para z
numa vizinhança da origem, (x, y, z) = (X(z), Y (z), z) seja solução do sistema. Defininido

f (x, y, z) = (f1 (x, y, z), f2 (x, y, z)) = (x + y + xyz, x − y + xz + yz),

temos " #
∂f1 ∂f1  
∂x (0, 0, 0) ∂y (0, 0, 0) 1 1
A= ∂f2 ∂f2 = .
∂x (0, 0, 0) ∂y (0, 0, 0)
1 −1

Como det A 6= 0 o teorema da função implı́cita garante a existência das funções X(z) e Y (z). Se
estivermos interessados em calcular as derivadas de X e Y a expressão para estas será
 0   −1  ∂f1 
X (0) 1 1 ∂z (0, 0, 0)
= .
Y 0 (0) 1 −1 ∂f2
∂z (0, 0, 0)

Exercı́cio 4.4.4 Mostre que a equação


   
sen x + sen y + sen z 0
=
sen x − sen y + sen3 z 0

admite uma solução da forma (x, y, z) = (X(z), Y (z), z), para |z| suficientemente pequeno, onde
X(z) e Y (z) são funções convenientes que verificam X(0) = Y (0) = 0. Calcule

∂X
(0).
∂z

Exercı́cio 4.4.5 Mostre que a equação sen x + y = 0 não tem solução x(y) definida para to-
dos valores de y. Porque que é que isto não contradiz o teorema da função implı́cita apesar de
d sen x
dx |x=0 6= 0 e sen 0 + 0 = 0?

O facto de não serem cumpridas as condições do teorema da função implı́cita não implica que
na vizinhança de um ponto não exista solução (ou que ela não seja única) de uma determinada
equação, tal como se pode verificar pelo exemplo seguinte:

Exemplo 4.4.5 Consideremos a equação

f (x, y) = x3 − y 3 = 0.

É facil verificar que f (0, 0) = 0. É também imediato que ∂f ∂f


∂x (0, 0) = ∂y (0, 0) = 0. Assim não
estamos nas condições do teorema da função implı́cita. No entanto a equação tem solução global,
única e diferenciável x = y.

O seguinte exercı́cio mostra que é possı́vel generalizar ligeiramente o teorema da função implı́cita
de modo a tratar casos semelhantes ao anterior.

Exercı́cio 4.4.6 Seja f : R2 → R uma função de classe C 1 , g, h : R → R funções contı́nuas


bijectivas. Mostre que se f (0, 0) = 0, h(0) = g(0) = 0 e ∂f ∂y (0, 0) 6= 0 então para x numa
vizinhança da origem a equação
f (g(x), h(y)) = 0

pode ser unicamente resolvida em ordem a y, sendo a solução da forma y = j(x) com j : R → R
uma função real de variável real.

24 de Janeiro de 2000 66
4.4. TEOREMA DA FUNÇÃO IMPLÍCITA

4.4.1 Exercı́cios suplementares


Exercı́cio 4.4.7 Considere o sistema de equações
(
sen(x + y + z) = z 4
x − y + z = sen(x4 + y 4 + z 4 ).

1. Prove que existem funções reais e diferenciáveis gx (z) e gy (z), definidas para |z| suficien-
temente pequeno, tais que gx (0) = gy (0) = 0 e (x, y, z) = (gx (z), gy (z), z)) é solução do
sistema.
2. Calcule gx0 (0) e gy0 (0).
3. Desenvolva gx em série de Taylor até à terceira ordem.

Exercı́cio 4.4.8 Seja α ∈ R e considere as funções fα : R3 → R definidas por

fα (x, y, z) = αz ch(x + y + z) − x2 ey

1. Determine para que valores de α a equação fα (x, y, z) = 0 define implicitamente, numa


vizinhança da origem, uma função z = Ψα (x, y)
2. Verifique que as funçoes Ψα têm um ponto de estacionaridade na origem, isto é, ∇Ψα (0, 0) =
0.

Exercı́cio 4.4.9 Considere a equação

kxk2 Ax = f (x, )

onde x ∈ Rn ,  ∈ Rk , A é uma matriz n × n não singular e f : Rn+k → Rn uma função C ∞ .


Mostre que se se verificar  
f (x, )
lim lim =0
→0 kxk→0 kxk3

a primeira equação define x como função diferenciável de  para (x, ) numa vizinhança de (0, 0).

Exercı́cio 4.4.10 (Função Implı́cita Topológica) Seja f : R2 → R, contı́nua. Suponha que


para cada x fixo se tem

lim f (x, y) = −∞ lim f (x, y) = +∞.


y→−∞ y→+∞

1. Prove que existe pelo menos uma função y(x) tal que f (x, y(x)) = 0 para todo o x ∈ R.
2. Dê um exemplo em que a função y(x) não seja única
3. Dê um exemplo em que a função y(x) não seja contı́nua.

4.4.2 Sugestões para os exercı́cios


4.4.7
1. Defina u(x, y, z) = sen(x + y + z) − z 4 e v(x, y, z) = x − y + z − sen(x4 + y 4 + z 4 ). Observe
que u(0, 0, 0) = v(0, 0, 0) = 0 e que
" # 
∂u ∂u 
∂x (0, 0, 0) ∂y (0, 0, 0) 1 1
∂v ∂v =
∂x (0, 0, 0) ∂y (0, 0, 0)
1 −1

tem determinante não nulo. Portanto podemos aplicar o teorema da função implı́cita.

67 24 de Janeiro de 2000
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA

2. gx0 (0) = −1 e gy0 (0) = 0


3. gx (z) = −z + O(z 4 ).
J
4.4.9 Aplique o teorema da função implı́cita à equação

f (x, )
Ax =
kxk2

e mostre que este problema é equivalente ao original. J


4.4.10

1. Utilize o teorema de Bolzano.


2. Escolha f de modo a que para cada x tenha pelo menos dois zeros, y1 (x) e y2 (x), distintos.
3. Utilize a função da alı́nea anterior e defina
(
y1 (x) se x > 0,
y(x) =
y2 (x) caso contrário.

24 de Janeiro de 2000 68
Bibliografia

[1] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.


[2] F. R. Dias Agudo. Lições de Análise Infinitesimal: I. Cálculo Diferencial em Rn . 1977.
[3] Luı́s Torres Magalhães. Integrais Múltiplos. Texto Editora, Lisboa, 2a edição, 1996.

[4] Luı́s Torres Magalhães. Álgebra Linear. Texto Editora, Lisboa, 1985.
[5] Luı́s Torres Magalhães. Integrais em Variedades. Texto Editora, Lisboa, 1994.
[6] Luı́s Torres Magalhães. Complementos de Cálculo Diferencial em Rn . AEIST, Lisboa, 1983.

69
Índice

aberto, 8 definida negativa, 39


aproximações sucessivas, 54 definida positiva, 39
hessiana, 34, 39
classe indefinida, 39
C 1 , 14 jacobiana, 14
C ∞ , 20 semidefinida negativa, 39
C k , 19 semidefinida positiva, 39
compacto, 10
convexo, 53 norma, 52
de um vector de Rn , 7
derivada, 12 de uma aplicação linear, 52
direccional, 13 de uma matriz, 52
dirigida, 13 normas equivalentes, 10
de ordem superior à primeira, 21
parcial, 13 polinómio
de ordem superior à primeira, 19 de Taylor, 23
diferenciabilidade, 12 homogéneo, 22
direcções singulares, 42 ponto
crı́tico, 30
fórmula de estacionaridade, 30
de Taylor, ver teorema de Taylor de sela, 31
fechado, 9 pré-imagem, 48
fecho, 10
forma resto da fórmula de Taylor, 23
de grau k, 41
quadrática série
definida negativa, 39 absolutamente convergente, 55
definida positiva, 39 Schwarz, 20
indefinida, 39 sistema de estacionaridade, 27, 40
semidefinida negativa, 39
semidefinida positiva, 39 Taylor, 23
fronteira, 10 teorema
função da função inversa, 53
diferenciável, 7, 12 de Lagrange, ver teorema do valor médio
implı́cita, 63 de Schwarz, 20
inversa, 50 de Taylor, 23
do valor médio
gradiente, 16 para funções vectoriais, 52
para funções escalares, 17
interior, 10
inversa local, 54 Weierstrass, 29

jacobiano, 57

método de Newton, 54
matriz

70

Você também pode gostar