Exercicios de Diferencial e Integral de Funçoes

Exercı́cios de Cálculo Diferencial e Integral de Funções
Definidas em Rn
Diogo Aguiar Gomes, João Palhoto Matos e João Paulo Santos
24 de Janeiro de 2000
2
Conteúdo
1 Introdução 5
1.1 Explicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Futura introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Complementos de Cálculo Diferencial 7

2.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Exercı́cios suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Sugestões para os exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Cálculo diferencial elementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Derivadas parciais de ordem superior à primeira . . . . . . . . . . . . . . . . . . . . 19
2.4 Polinómio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 Extremos 27
3.1 Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Testes de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Teoremas da Função Inversa e da Função Implı́cita 47

4.1 Invertibilidade de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.1.1 Exercı́cios Suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2 Teorema do valor médio para funções vectoriais . . . . . . . . . . . . . . . . . . . . 52
4.3 Teorema da Função Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.1 Exercı́cios Suplementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4 Teorema da Função Implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bibliografia 69
3
CONTEÚDO
24 de Janeiro de 2000 4
Capı́tulo 1
Introdução
1.1 Explicação
Está a ler uma versão parcial e preliminar de um texto em elaboração. Os autores agradecem
quaisquer notificações de erros, sugestões,. . . , para ecdi@math.ist.utl.pt. Estima-se que o texto
final terá uma extensão cerca de três a quatro vezes maior e incluirá capı́tulos que nesta versão
foram excluı́dos.
A secção seguinte desta introdução tem carácter preliminar e tem como pressuposto a existência
do material que aqui ainda não foi incluı́do.
Partes deste texto foram distribuı́das separadamente por cada um dos autores no passado.
Tendo descoberto que os diversos textos tinham carácter algo complementar decidimos reuni-los.
A presente versão idealmente não mostra de uma maneira óbvia as adaptações e correcções que
foram necessárias para chegar ao formato actual.
Novas versões deste texto irão aparecendo sempre que os autores considerarem oportuno em
http://www.math.ist.utl.pt/~jmatos/AMIII/temp.pdf. Para evitar a proliferação de textos
obsoletos a maioria das páginas apresenta a data de revisão corrente em pé de página.
1.2 Futura introdução

Este texto nasce da nossa experiência a leccionar a disciplina de Análise Matemática III no Instituto
Superior Técnico. Por um lado reune um número considerável de enunciados de problemas de
exame e por outro serve de propaganda à nossa maneira de ver os assuntos aqui tratados. Análise
Matemática III é uma disciplina do primeiro semestre do segundo ano de todos os currı́culos de
licenciatura leccionados no Instituto Superior Técnico (IST) excepto Arquitectura.
Se se perguntar a um aluno de um dos dois primeiros anos do IST que tipo de “folhas” mais
deseja que lhe sejam disponibilizadas pelos seus professores temos como resposta mais que provável:
“folhas de exercı́cios resolvidos de Análise Matemática”. No entanto tal resposta costuma suscitar
como reacção da parte dos docentes essencialmente preocupação. De facto a resolução de exercı́cios
de Análise Matemática não é geralmente única e o processo de aprendizagem está mais ligado à
tentativa de resolução dos mesmos quando se possui um conjunto de conhecimentos mı́nimo do
que à absorção acéfala de um número finito de receitas.
O que se segue é uma tentativa de compromisso entre a procura e a oferta neste mercado
sui generis. São incluı́dos exercı́cios de exame dos últimos anos com modificações do enunciado
quando tal foi julgado conveniente e muitos outros com um carácter mais ou menos trivial, ou de
complemento de resultados citados, ou de comentário de uma resolução de um exercı́cio, sugestão
de extensões, etc. Por vezes um exercı́cio embora incluı́do numa secção inclui uma questão que
só é tratada numa secção posterior. Tais exercı́cios estão assinalados com um asterisco *. Foram
incluı́dos esboços de resolução e sugestões em número considerável.
5
CAPÍTULO 1. INTRODUÇÃO
O leitor deverá ter em consideração que o programa de Análise Matemática III tem variado
ao longo do tempo. É consensual no Departamento de Matemática do IST e na escola em geral
que a introdução à análise em Rn e o cálculo diferencial em Rn deverão ser tratados em grande
parte no primeiro ano do curso. Daı́ a existência de secções correspondentes a revisão de material
coberto no primeiro ano do curso.
Outro facto a ter em conta é a diferença de programa para os cursos de Matemática Aplicada
e Computação e Engenharia Fı́sica Tecnológica. Nestes cursos são introduzidos o formalismo das
formas diferenciais e a respectiva versão do teorema fundamental do cálculo em vez da formulação
clássica do teorema de Stokes. Aconselha-se os alunos destes dois cursos a comparar os enunci-
ados de exercı́cios deste tema com as formulações clássicas dos mesmos. Tais comparações estão
indicadas em nota de pé de página.
A notação utilizada é clássica tanto quanto possı́vel, embora obviamente não universal, e nem
sempre será isenta de incoerências. Por exemplo: usaremos a notação de Leibniz para derivadas
∂2u ∂ ∂u
parciais mas de acordo com a notação geral para operadores, isto é, ∂x∂y = ∂x ∂y ; usaremos
RR RRR
, sempre que tal for considerado sugestivo.
Citaremos os resultados essenciais de cada tema mas não necessariamente com a sua formulação
mais geral remetida por vezes para observações marginais ou problemas. O enunciado de tais resul-
tados por vezes é seguido de uma “demonstração” que mais não faz que relembrar sinteticamente
a dependência em relação a outros resultados e os métodos utilizados.
Faz-se notar que não seguimos a ordenação de material geralmente adoptada durante a ex-
posição dos cursos no IST devido devido a razões como a conveniência em apresentar problemas
sobre a introdução do conceito de variedade como complemento do estudo do teorema da função
implı́cita.
Um último aviso: este texto não pretende substituir os excelentes livros de texto disponı́veis
sobre os assuntos aqui abordados. Diria mesmo que é provavelmente incompreensı́vel se um ou
mais desses livros não for consultado. Os textos adoptados no IST são [6, 3, 5].
Lisboa, Outubro de 1999
DG, JPM, JPS
Capı́tulo 2
Complementos de Cálculo
Diferencial
O conceito de função diferenciável é uma das noções chave da análise. Por exemplo, se f : R → R
for diferenciável em x0 , o cálculo de f 0 (x0 ) permite aproximar f pela fórmula de Taylor perto de
x0 , i.e.,
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + o(x − x0 ),
onde limx→x0 o(x−x

x−x0
0)
= 0. Esta fórmula tem a seguinte interpretação geométrica: f 0 (x0 ) é o
declive da recta tangente a f em x0 e y = f (x0 ) + f 0 (x0 )(x − x0 ) é a equação dessa recta.
Outras aplicações do conceito de derivada familiares a um estudante que conheça Análise
Matemática ao nı́vel de um primeiro ano de licenciatura são, por exemplo, a determinação de
pontos de extremo: se f : R → R for diferenciável, os seus máximos ou mı́nimos são zeros de f 0 1 .
Outra aplicação que deve ser familiar é a mudança de coordenadas na integração através de:
Z b Z f −1 (b)
g(x)dx = g(f (y))f 0 (y)dy.
a f −1 (a)
Esta presença ubı́qua da diferenciação no estudo de funções reais de variável real faz com que
seja natural, quando se estudam funções de várias variáveis, generalizar a noção de derivada. Para
funções de Rn em R, a interpretação geométrica da derivada será o “declive” do “plano” tangente
ao gráfico da função, mais precisamente y = f (x0 ) + Df (x0 )(x − x0 ) é a equação desse “plano”
tangente2 .
Neste capı́tulo resumiremos alguns resultados de cálculo diferencial, para funções reais de mais
do que uma variável real. Em particular trataremos questões importantes sobre a continuidade e
diferenciabilidade de funções de Rn em Rm . Para além disso estudaremos a fórmula de Taylor.
2.1 Preliminares
Esta secção relembra alguns dos conceitos e resultados sobre funções de Rn em Rm que se supõem
conhecidos nas secções seguintes. Aconselha-se o leitor a consultar [1] para relembrar, com detalhe,
os resultados, supostos já conhecidos, que a seguir se enumeram de uma forma necessariamente
breve.
Tanto a definição de continuidade como a de diferenciabilidade dependem do conceito de dis-
tância entre dois pontos, definida por sua vez à custa da noção de norma:
1 Note, no entanto, que o facto de a derivada se anular num ponto, não implica que este seja um máximo ou
mı́nimo; pode ser ponto de sela! Veja o capı́tulo 3.
2 Designações técnicas para um tal conjunto são de um subespaço afim de dimensão n de Rn+1 ou hiperplano
7
CAPÍTULO 2. COMPLEMENTOS DE CÁLCULO DIFERENCIAL
Definição 2.1.1 Seja η : Rn → R. Diz-se que η é uma norma se verificar as seguintes proprie-
dades:
i) η(x) > 0 se x 6= 0 e η(0) = 0;
ii) η(λx) = |λ|η(x), ∀x ∈ Rn , ∀λ ∈ R;
iii) η(x + y) ≤ η(x) + η(y), ∀x, y ∈ Rn .
Para designarmos uma norma genérica utilizaremos a notação kxk = η(x). Em Rn é usual
considerar a norma euclideana, definida por
q
k(x1 , . . . , xn )k = x21 + . . . + x2n .
Porém, em certas situações, pode ser útil trabalhar com normas diferentes.
Exercı́cio 2.1.1 Prove que as seguintes funções são normas em R2 :

1. η(x, y) = |x| + |y|
2. η(x, y) = máx {|x|, |y|}
p
3. η(x, y) = 2 x2 + y 2
p
4. η(x, y, z) = |x| + y 2 + z 2 .
Exercı́cio 2.1.2 Mostre que η(x, y) = |x + y| não é uma norma mas satisfaz ii e iii em 2.1.1.
Definição 2.1.2 Em Rn , a bola (aberta) centrada em x e de raio r, relativa à norma k · k, é o

conjunto B(x, r) (ou Br (x)) definido por
B(x, r) = {y ∈ Rn : kx − yk < r}.
Se a norma em questão for a norma euclideana as bolas serão “redondas”, caso contrário poderão
ter formatos mais ou menos inesperados, como se pode ver no exercı́cio seguinte.
Exercı́cio 2.1.3 Esboce as bolas B1 (0) em R2 para as seguintes normas:

p
1. k(x, y)k = x2 + y 2
2. k(x, y)k = |x| + |y|
3. k(x, y)k = máx{|x|, |y|}
Exercı́cio 2.1.4 Mostre que uma bola será sempre um conjunto convexo, isto é, dados dois quais-
quer dos seus pontos, o segmento de recta que os une está contido na bola.
Daqui para a frente vamos sempre supor que a norma em Rn é a norma euclideana, a não ser
que seja dito algo em contrário. Além disso a notação não distinguirá as normas euclidianas em
diferentes espaços Rn para n ≥ 2.
Definição 2.1.3 Diz-se que um conjunto A ⊂ Rn é aberto se verificar a seguinte propriedade:
∀x ∈ A, ∃r > 0 : B(x, r) ⊂ A.
Exemplo 2.1.1 O conjunto ]0, 1[ ⊂ R é aberto. Com efeito, para qualquer número real 0 < x < 1
temos x > 1/2 ou x ≤ 1/2. No primeiro caso B(x, x/2) ⊂ ]0, 1[, no segundo B(x, (1−x)/2) ⊂ ]0, 1[.
Exercı́cio 2.1.5 Mostre que as bolas abertas são conjuntos abertos.
2.1. PRELIMINARES
Temos reunidos todos os ingredientes ncessários à definição de função contı́nua:
Definição 2.1.4 Diz-se que uma função f : A ⊂ Rn → Rm é contı́nua num ponto x ∈ A se:
∀ > 0 ∃δ > 0 tal que kx − yk < δ, y ∈ A ⇒ kf (x) − f (y)k < .
Diz-se que f é contı́nua num subconjunto do seu domı́nio se for contı́nua em todos os pontos desse
conjunto.
Exemplo 2.1.2 Suponhamos f (x, y) = x + y. Provemos que f é contı́nua. Seja > 0 arbitrário.
Reparemos que, para todo o (x1 , y1 ) e (x2 , y2 ), se tem
|x1 + y1 − x2 − y2 | ≤ |x1 − x2 | + |y1 − y2 |,
sendo que |x1 − x2 | ≤ k(x1 , y1 ) − (x2 , y2 )k e |y1 − y2 | ≤ k(x1 , y1 ) − (x2 , y2 )k. Portanto, fixando
> 0, e escolhendo δ < 2 teremos:
|x1 + y1 − x2 − y2 | ≤ 2δ < ,
se k(x1 , y1 ) − (x2 , y2 )k < δ. Logo f é contı́nua.
Exercı́cio 2.1.6 Mostre que a função definida por

(
1, se x + y > 0,
f (x, y) =
0, se x + y ≤ 0
não é contı́nua.
Muitas vezes, para mostrar continuidade (ou a falta dela), utiliza-se a caracterização de conti-
nuidade através de sucessões:
Teorema 2.1.1 (Continuidade à Heine)
Seja f : A ⊂ Rn → Rm . f é contı́nua em x0 ∈ A se e somente se para toda a sucessão (xk )k∈N ⊂ A
que converge para x0 (isto é, limk→+∞ kxk − x0 k = 0) a sucessão (f (xk ))k∈N converge para f (x0 ).
Exemplo 2.1.3 Seja f : Rn → Rm , g : Rm → Rp , f e g contı́nuas. Provemos que g ◦ f é

contı́nua. Seja x0 ∈ Rn e (xk ) ⊂ Rn uma sucessão convergente para x0 . Definindo yk = f (xk )
obtemos uma sucessão (yk ) ⊂ Rm que converge para y0 = f (x0 ), uma vez que f é contı́nua. A
sucessão (zk ) ⊂ Rp , definida por zk = g(yk ), converge para z0 = g(y0 ), uma vez que g é contı́nua.
Resta observar que zk = g ◦ f (xk ) → z0 = g ◦ f (x0 ), pelo que g ◦ f é contı́nua.
Exercı́cio 2.1.7 Refaça o exemplo anterior usando a definição 2.1.4.
Exercı́cio 2.1.8 Prove o teorema 2.1.1.
Exercı́cio 2.1.9 Seja f : Rn → Rm . Prove que f é contı́nua se e somente se para todo o aberto
A ⊂ Rm se tem f −1 (A) ⊂ Rn aberto, onde o conjunto f −1 (A) é definido como sendo:
f −1 (A) = {x ∈ Rn : f (x) ∈ A}.
Generalize este resultado para funções definidas num subconjunto arbitrário de Rn .
Definição 2.1.5 Diz-se que um conjunto F ⊂ Rn é fechado se o seu complementar F c for aberto.
Teorema 2.1.2 (Caracterização dos fechados via sucessões)

F ⊂ Rn é fechado se e só se dada uma qualquer sucessão convergente de termos em F esta converge
para um elemento de F .
9 24 de Janeiro de 2000
Exercı́cio 2.1.10 Dê dois exemplos distintos de subconjuntos de Rn que sejam, cada um deles,
simultaneamente aberto e fechado (isto só se verifica para dois conjuntos muito especiais!).
Definição 2.1.6 A união de todos os abertos contidos num conjunto A será designada por interior
de A e abrevia-se int A. À intersecção de todos os fechados contendo A chamar-se-á fecho de A e
abrevia-se A. A fronteira de A, ∂A, é definida por ∂A = A \ int A.
Definição 2.1.7 Diz-se que um conjunto K ⊂ Rn é compacto se dada uma qualquer sucessão de
termos em K esta possui uma subsucessão convergente para um elemento de K.
Teorema 2.1.3 (Caracterização dos compactos de Rn )

K ⊂ Rn é compacto se e só se K é limitado e fechado.
Exercı́cio 2.1.11 O conjunto vazio é compacto? E o conjunto dos números racionais de valor
absoluto menor que 1?
Exercı́cio 2.1.12 Dê um exemplo de uma função f : Rn → R tal que

1. {x ∈ Rn : f (x) ≤ 1} seja um conjunto compacto.
2. {x ∈ Rn : f (x) < 1} seja um conjunto compacto não vazio. Observação: se f for contı́nua
então este conjunto é necessariamente aberto (porquê?) portanto se escolher f contı́nua o
conjunto será necessariamente vazio (porquê?).
3. Seja K um conjunto compacto. Construa uma função f tal que K = {x : f (x) = 1}.
Escolhendo f não contı́nua o problema é trivial. No entanto pode tornar o problema bem
mais interessante tentando construir f contı́nua!
2.1.1 Exercı́cios suplementares

Exercı́cio 2.1.13 Diz-se que duas normas em Rn , k · kα e k · kβ , são equivalentes se existirem
constantes positivas, a e b tais que
akxkα ≤ kxkβ ≤ bkxkα
para todo o x ∈ Rn . Prove que as seguintes normas são todas equivalentes entre si:
1. k(x1 , . . . , xn )k1 = |x1 | + . . . + |xn |
p
2. k(x1 , . . . , xn )k2 = |x1 |2 + . . . + |xn |2
3. k(x1 , . . . , xn )k∞ = máx{|x1 |, . . . , |xn |}
Exercı́cio 2.1.14 Prove que as seguintes funções são contı́nuas:

1. f (x) = 1 se −∞ < x ≤ 1 e f (x) = x se x ≥ 1;
2. qualquer polinómio em n variáveis.
Exercı́cio 2.1.15 Prove que (

0, se x < 0,
f (x) =
1, se x ≥ 0,
não é contı́nua.
Exercı́cio 2.1.16 Diz-se que uma função f : J ⊂ Rn → R é semicontı́nua inferior se para toda
a sucessão xk → x ∈ J se tem lim inf j→+∞ f (xk ) ≥ f (x) (recorde que o lim inf de uma sucessão
(yk )k∈N é definido como sendo lim inf k→+∞ yk = limn→+∞ inf k>n {yk }).
2.1. PRELIMINARES
1. Mostre que o lim inf existe sempre (eventualmente pode ser igual a −∞, quando?).
2. Mostre que qualquer função contı́nua é semicontı́nua inferior.
3. Dê um exemplo de uma função semicontı́nua inferior que não seja contı́nua.
4. Mostre que qualquer função semicontı́nua inferior f definida num compacto K é limitada
inferiormente, isto é ∃C ∈ R tal que f (x) ≥ C sempre que x ∈ K.
5. Mostre que uma função semicontı́nua inferior definida num compacto tem sempre mı́nimo.
6. Utilizando as ideias das alı́neas anteriores mostre que qualquer função contı́nua definida num
compacto tem máximo e mı́nimo.
Exercı́cio 2.1.17 As definições de aberto e função contı́nua dependem aparentemente de usarmos

a norma euclidiana. Uma dúvida legı́tima é saber se tivessemos usado outra norma chegarı́amos às
mesmas conclusões relativamente a que conjuntos são abertos e que funções são contı́nuas. Mostre
que:
1. Todas as normas em Rn são contı́nuas.
2. Qualquer norma em Rn tem um mı́nimo positivo na fronteira da bola B(0, 1).
3. Todas as normas em Rn são equivalentes.
4. Conclua que as noções de aberto e função contı́nua são independentes da norma utilizada.
2.1.2 Sugestões para os exercı́cios

2.1.13 Observe que ∀x ∈ Rn
1. kxk∞ ≤ kxk1 ≤ nkxk∞ ;
√
2. kxk∞ ≤ kxk2 ≤ nkxk∞ .
Usando 1 e 2 deduza as restantes desigualdades. J
2.1.14 Utilize a definição 2.1.4 e o teorema 2.1.1. J
2.1.15 Note que f − n1 → 0 6= f (0).

J
2.1.16
1. Note que a sucessão zn = inf k>n {yk } é monótona crescente.
2. Se f é contı́nua e xk → x então f (xk ) → f (x).
3. Por exemplo (
0 se x ≤ 0,
f (x) =
1 se x > 0.
4. Se f não fosse limitada inferiormente existiria uma sucessão xk ∈ K tal que f (xk ) →
−∞. Como K é compacto poder-se-ia extrair uma subsucessão convergente xkj → x ∈
K. Consequentemente ter-se-ia −∞ = lim f (xkj ) = lim inf f (xkj ) ≥ f (x) > −∞ o que é
absurdo.
5. Seja f : K → R, onde K ⊂ Rn é compacto, semicontı́nua inferior. Note que, pela alı́nea
anterior, f é minorada. Defina-se m = inf y∈K f (y). Então existe uma sucessão xk ∈ K tal
que f (xk ) → m. Como K é compacto, existe uma subsucessão xkj que converge para algum
x ∈ K. Por semicontinuidade inferior tem-se
m = lim f (xkj ) = lim inf f (xkj ) ≥ f (x)
j→+∞ j→+∞
mas por outro lado f (x) ≥ inf y∈K f (y) = m portanto f (x) = m.
y = f(x)
b y = b + f'(a)(x-a)
a x
Figura 2.1: A interpretação geométrica de derivada para funções reais de variável real.
6. Se f é contı́nua então f e −f são semicontı́nuas inferiores.

J
2.2 Cálculo diferencial elementar

Vamos começar por definir função diferenciável .
Definição 2.2.1 Seja U ⊂ Rn um aberto. Diz-se que uma função f : U → Rm é diferenciável no

ponto x0 ∈ U se existir uma aplicação linear A de Rn em Rm , para a qual se tem
kf (x0 + h) − f (x0 ) − Ahk
lim = 0.
h→0,h∈Rn khk
Será à aplicação linear A na definição anterior que chamaremos derivada3 de f no ponto x0 .
No entanto poderia existir mais do que uma aplicação linear nestas condições. . .
Problema 2.2.1 Mostre que a aplicação linear A da definição 2.2.1 se existir é única.
Definição 2.2.2 A aplicação linear A da definição 2.2.1 designa-se por derivada de f em x0

escrevendo-se Df (x0 ).
Esta definição de derivada coincide com a definição usual de derivada para funções reais de
variável real. Para este caso, a aplicação linear A referida na definição anterior é simplesmente
multiplicação por um escalar.
Exercı́cio 2.2.1 Suponha f : U ⊂ Rn → Rm é diferenciável num ponto x0 ∈ int U . Prove que
f (x0 + h) = f (h0 ) + Df (x0 )(h) + o(h),
onde limh→0,h∈Rm o(h)

khk = 0.
Definição 2.2.3 Diz-se que uma função f : U ⊂ Rn → Rm . Se U for aberto dizemos que f é
diferenciável em U se o for em todos os pontos do domı́nio U . Se U não for aberto dizemos que
f é diferenciável em U se existir um prolongamento f de f a um aberto V contendo U tal que f
seja diferenciável em V .
3 Tal aplicação será muitas vezes identificada com a matriz real m × n que a representa ou com um vector se n
ou m for igual a 1. Se n = 1 é comum usar f 0 (x0 ) em vez de Df (x0 ).
2.2. CÁLCULO DIFERENCIAL ELEMENTAR
Exemplo 2.2.1 Seja f definida em R por f (x) = x3 . Mostremos que ela é diferenciável em
qualquer ponto de x ∈ R e que a sua derivada é 3x2 .
Com efeito temos
|(x + h)3 − x3 − 3x2 h| |3xh2 + h3 |

lim = lim = 0.
h→0 |h| h→0 |h|
A verificação da diferenciabilidade usando directamente a definição pode ser, mesmo em casos

simples, penosa. Isso não acontece, no entanto, no caso ilustrado no próximo exercı́cio.
Exercı́cio 2.2.2 Mostre que uma transformação linear f : Rm → Rn , dada por f (x) = M x, onde
M é uma matriz n × m, é diferenciável e que Df = M .
As funções diferenciáveis formam um subconjunto estrito das funções contı́nuas. Com efeito:
Exercı́cio 2.2.3 Mostre que qualquer função diferenciável é contı́nua.
Consideremos uma função f : U ⊂ Rn → Rm e fixemos um vector v ∈ Rn . Dado um ponto

x0 ∈ U , podemos restringir a função f à recta que passa por x0 e com sentido definido por v. A
derivada “ao longo” desta recta chama-se derivada dirigida:
Definição 2.2.4 Define-se a derivada dirigida da função f : U ⊂ Rn → Rm no ponto x0 ∈ U ,

segundo o vector v ∈ Rn como sendo
f (x0 + λv) − f (x0 )

Dv f (x0 ) = lim .
λ→0 λ
se o limite existir.
Este uma relação simples entre derivadas dirigidas relativamente a vectores com a mesma
direcção (qual?). Daı́ “normalizarmos” as derivadas dirigidas considerando muitas vezes v como
sendo unitário. Nesse caso designamos a derivada dirigida como derivada direccional .
A definição de derivada dirigida é mais fraca do que a definição de função diferenciável. Com
efeito há funções que não são diferenciáveis num determinado ponto mas que admitem derivadas
dirigidas. Pode mesmo acontecer que uma função admita algumas (ou todas!) as derivadas
dirigidas num determinado ponto mas que não seja sequer contı́nua nesse ponto.
Exemplo 2.2.2 Consideremos a função definida por

(
1, se x ∈
/ Q,
f (x, y) =
0, se x ∈ Q.
Claramente esta função não é contı́nua. No entanto, ela admite derivada dirigida na direcção
(0, 1). Fixemos um ponto (x0 , y0 ). Se x0 for racional teremos f (x0 , y0 + h) = 0, para qualquer
h ∈ R. Deste modo
D(0,1) f (x0 , y0 ) = 0.
Analogamente se x0 for irracional teremos f (x0 , y0 + h) = 1, para todo o h ∈ R. Pelo que também
se terá
D(0,1) f (x0 , y0 ) = 0.
As derivadas direccionais de funções f : U ⊂ Rn → R na direcção dos eixos coordenados e no

sentido crescente da coordenada são frequentemente utilizadas e por isso têm um nome especial:
derivadas parciais.
Definição 2.2.5 Seja f : U ⊂ Rn → R. A derivada parcial de f em relação a xi é definida, caso

o limite exista, por
∂f f (x + λei ) − f (x)
(x) = Dei f (x) = lim ,
∂xi h→0 λ
com x = (x1 , . . . , xn ) e sendo ei o versor da direcção i. Por vezes usaremos a notação Di f em
∂f
vez de ∂xi
.
Analisando a definição facilmente se conclui que, em termos práticos, a derivada parcial de f

em ordem a xi é calculada coordenada a coordenada se m > 1, o que permite lidar só com funções
escalares, e, para cada uma destas, fixando todas as variáveis excepto xi e derivando cada fj em
ordem a xi como se esta fosse uma função real de variável real.
Exemplo 2.2.3 Seja g(x, y) = (x2 y 2 , x). As derivadas parciais de g em ordem a x e y são
∂g ∂g
= (2xy 2 , 1) = (2x2 y, 0).
∂x ∂y
Exercı́cio 2.2.4 Calcule a derivada parcial em ordem a y das seguintes funções
1. f (x, y, z) = xyz;
2. f (x, y) = x2 + sen(xy);
3. f (x, y, z, w) = 0.
Se uma função é diferenciável as derivadas parciais permitem construir facilmente a matriz

representando a derivada.
Proposição 2.2.1
Se uma função f : U ⊂ Rn → Rm é diferenciável em a então a derivada Df (a) satisfaz Df (a)(h) =
Jf (a)h em que é a matriz jacobiana de f no ponto a definida por
 ∂f1 ∂f1 
∂x1 (a) ... ∂xm (a)
Jf (a) =  .. ..
.
 
. .
∂fn ∂fn
∂x1 (a) . . . ∂xm (a)
A diferenciabilidade de uma função pode ser estabelecida facilmente à custa da continuidade

das derivadas parciais:
Definição 2.2.6 Diz-se que uma função f : U ⊂ Rn → Rm com U aberto é de classe C 1 (U ) se

existirem as derivadas parciais
∂fj
, 1 ≤ j ≤ m, 1 ≤ i ≤ n
∂xi
e forem contı́nuas. Se U não fôr aberto dizemos que f ∈ C 1 (U ) se existir um aberto V ⊃ U e uma
função g : V → Rm tal que g|U = f e g ∈ C 1 (V ).
Exemplo 2.2.4 A função f (x, y) = x2 y 2 é de classe C 1 pois as suas derivadas parciais são
contı́nuas (veja exemplo 2.2.3).
Exemplo 2.2.5 Calculemos a derivada da função
f (x, y, z, w) = (f1 , f2 , f3 ) = (x + y, x + y + z 2 , w + z).
Aplicando os resultados e observações anteriores temos

 ∂f ∂f1 ∂f1 ∂f1
 
1 
∂x ∂y ∂z ∂w 1 1 0 0
Jf =  ∂f
 2 ∂f2 ∂f2 ∂f2  
∂x ∂y ∂z ∂w  = 1 1 2z 0
∂f3 ∂f3 ∂f3 ∂f3 0 0 1 1
∂x ∂y ∂z ∂w
pelo que a função é C 1 , logo diferenciável e a derivada é representada pela matriz Jf .
Proposição 2.2.2 (C 1 implica diferenciabilidade)

Uma função f : U ⊂ Rn → Rm de classe C 1 (U ) com U aberto é diferenciável em U .
Ideia da demonstração. Claro que basta supor m = 1. Além disso consideramos n = 2 pois tal
permite usar notação mais simples e quando terminarmos será óbvio como generalizar para n > 2.
Seja (x, y) ∈ U . Basta provar que
f (x + h, y + k) − f (x, y) − h ∂f ∂f
∂x (x, y) − k ∂y (x, y)
lim 1/2
= 0.
(h,k)→(0,0) (h2 + k 2 )
Para tal decompomos a diferença f (x+h, y +k)−f (x, y) como uma soma de parcelas de diferenças
de valores de f em que em cada parcela os argumentos de f só diferem numa coordenada. Uma
escolha possı́vel é
f (x + h, y + k) − f (x, y) = [f (x + h, y + k) − f (x, y + k)] + [f (x, y + k) − f (x, y)].
Podemos assim lidar separadamente com cada coordenada reduzindo o nosso objectivo a provar
f (x + h, y + k) − f (x, y + k) − h ∂f
∂x (x, y)
lim 1/2
= 0, (2.1)
(h,k)→(0,0) (h2 + k 2 )
f (x, y + k) − f (x, y) − k ∂f
∂y (x, y)
lim 1/2
= 0. (2.2)
(h,k)→(0,0) (h2 + k 2 )
Para lidar com (2.1) use o teorema de Lagrange, aplicado a g(t) = f (x + t, y + k) − f (x, y + k),
para obter que existe θ, 0 < θ < 1, tal que f (x + h, y + k) − f (x, y + k) = h ∂f
∂x (x + θh, y + k) e
use a continuidade da derivada parcial. Para lidar com (2.2) pode usar um raciocı́nio análogo ou
simplesmente a definição de derivada parcial.
Problema 2.2.2 Verifique que a demonstração da proposição 2.2.2 permite enunciar o resultado
sob hipóteses mais gerais. Dê um exemplo de uma função que satisfaça tais hipóteses e não seja
C 1 . Altere a demonstração para obter o caso n > 2.
Exercı́cio 2.2.5 Mostre que são diferenciáveis e calcule a derivada das seguintes funções:
1. f (x, y, z) = (x2 − y 2 , xy)
2. f (x, y) = (x − y, x + y, 2x + 3y)
3. f (x, y) = (sen(x + y), cos(x − y))
4. f (x, y) = (ex+y+z , log(1 + ey ), z 2 + x)
No caso de funções escalares (m = 1) a derivada é representada por uma matriz linha que
se identifica a um vector de Rn que merece um nome especial pela sua importância no cálculo
diferencial e nas aplicações.
Definição 2.2.7 Suponha que uma função f : U ⊂ Rn → R possui todas as derivadas parciais
num ponto a ∈ U . Define-se o gradiente de f em a, ∇f (a), via

∂f ∂f
∇f (a) = (a), . . . , (a) .
∂x1 ∂xn
Exercı́cio 2.2.6 Verifique que se f : U ⊂ Rn → R é diferenciável em a ∈ U então:
1. Df (a)(h) = Dh f (a) = ∇f (a) · h;
2. supkhk=1 Dh f (a) = k∇f (a)k.
Exercı́cio 2.2.7 Mostre que a derivada da composição f ◦ g das transformações lineares f (y) =
Ay, g(x) = Bx, onde f : Rn → Rm , g : Rp → Rn e A, B são matrizes reais m × n e n × p,
respectivamente, é a matriz AB.
O próximo teorema fornece um método de cálculo da derivada de funções obtidas por com-
posição. Note que para aplicações lineares a demonstração é trivial (exercı́cio 2.2.7) e sugere o
resultado geral: a derivada da composta é a composta das derivadas. Mais precisamente:
Teorema 2.2.3 (Derivação da Função Composta ou Regra da Cadeia)

Sejam f : V ⊂ Rn → Rm e g : U ⊂ Rp → Rn , funções diferenciáveis, a ∈ U, f (a) ∈ V com U e V
abertos. Então f ◦ g : U ∩ f −1 (V ) → Rm é diferenciável em a e verifica-se:
D(f ◦ g)(a) = Df (g(a)) ◦ Dg(a).
Se f e g forem de classe C 1 então h é de classe C 1 .
De um ponto de vista de cálculo as derivadas parciais da composta são calculáveis em termos das
derivadas parciais das funções que definem a composição usando o resultado anterior e o facto de à
composição de aplicações lineares corresponder o produto de matrizes que as representam. Assim
é importante compreender exemplos cujo protótipo mais simples é do tipo seguinte:
Exemplo 2.2.6 Seja f : R2 → R e g = (g1 , g2 ) : R → R2 . Se f e g forem diferenciáveis então
d(f ◦ g) ∂f dg1 ∂f dg2

(t) = (g1 (t), g2 (t)) (t) + (g1 (t), g2 (t)) (t).
dt ∂x1 dt ∂x1 dt
Um outro exemplo do mesmo género é:
Exemplo 2.2.7 Seja f (x, y) = (x + y, x − y) e g(t1 , t2 , t3 ) = (t1 + 2t2 , t2 + 2t3 ). f e g são

diferenciáveis. A derivada de f ◦ g é
D(f ◦ g)(t1 , t2 , t3 ) =Df (g(t1 , t2 , t3 ))Dg(t1 , t2 , t3 ) =

1 1 1 2 0 1 3 2
= = .
1 −1 0 1 2 1 1 −2
Quando não há risco de confusão sobre os pontos em que se calculam as diversas derivadas
parciais é comum abreviar uma fórmula como a do exemplo 2.2.6 como segue:
d ∂f dg1 ∂f dg2
(f ◦ g) = +
ou
d ∂f dx1 ∂f dx2
(f ◦ g) = + .
Há risco de confusão em situações como a seguinte:
Exercı́cio 2.2.8 Suponha que f : R2 → R é diferenciável, f (0, 1) = 0 e f (1, 0) = 0. Seja

g(x, y) = f (f (x, y), f (y, x)). Calcule
∂g
(0, 1)
∂x
em termos de derivadas parciais de f em pontos convenientes. Convir-lhe-á usar a notação Di f
para evitar ambiguidades.
Exercı́cio 2.2.9 Calcule a derivada da composição h = f ◦ g nos seguintes casos:

1. f (x, y, z) = x2 + y 2 + z 2 e g(t) = (t, 2t, 3t)
2. f (x, y) = (xy 5 + y ch y 2 , x tg(sh x2 ) + 3y, x − y) e g(t) = (3, 4).
Exercı́cio 2.2.10 Seja f : U ⊂ Rn → R e g : [a, b] → U diferenciáveis tais que f é constante no

contradomı́nio de g. Mostre que ∇f (g(t)) · g 0 (t) = 0 para todo o t ∈ [a, b]. Interprete este resultado
como significando que, para funções diferenciáveis, o gradiente é ortogonal aos conjuntos de nı́vel
da função.
O teorema de derivação da função composta permite generalizar alguns resultados com facili-
dade à custa de resultados já conhecidos para funções reais de variável real. Por exemplo o teorema
de Lagrange para funções escalares em que se relaciona a diferença entre os valores de uma função
em dois pontos e a derivada no segmento de recta4 que os une.
Teorema 2.2.4 (do valor médio ou de Lagrange)

Sejam U ⊂ Rn um aberto e f : U → R uma função diferenciável. Se x, y ∈ U e L(x, y) ⊂ U então
existe θ ∈ ]0, 1[ tal que
f (y) − f (x) = ∇f (x + θ(y − x)) · (y − x).
Exercı́cio 2.2.11 Prove o teorema do valor médio. Sugestão: considere a função de variável real
g(t) = f (x + t(y − x)) e aplique o teorema do valor médio para funções a uma variável.

Exercı́cio 2.2.12 Seja f : R2 → R definida por
xy 2
(
x2 +y 4 , se (x, y) 6= (0, 0)
f (x, y) =
0, se (x, y) = (0, 0).
a) Determine justificadamente o maior subconjunto do domı́nio de f em que esta função é

contı́nua.
b) Uma função H : R2 → R2 verifica H(0, 1) = (1, −1) é diferenciável em (0, 1) sendo a matriz
jacobiana de H nesse ponto dada por

1 −1
JH (0, 1) = .
1 2
Calcule a derivada dirigida D(1,1) (f ◦ H)(0, 1).
*Exercı́cio 2.2.13 Se f : R2 → R está definida por

( 3 3
x −y
2 2, se (x, y) 6= (0, 0)
f (x, y) = x +y
0, se (x, y) = (0, 0).
4 Dados x, y ∈ Rn define-se o segmento de recta unindo x a y como sendo o conjunto L(x, y) = {z = x+t(y−x) :
t ∈ [0, 1]}.
a) Calcule o valor máximo de Dh f (1, 2) quando h é um vector unitário.

b) Calcule a equação do plano tangente ao gráfico de f no ponto (x, y, z) = (1, 2, −7/5).
*c) Decida justificadamente se o gráfico de f constitui ou não uma variedade diferenciável. Se
optar pela negativa determine o maior subconjunto do gráfico de f que efectivamente constitui
uma variedade diferenciável. Em qualquer caso determine justificadamente a dimensão da
variedade e o espaço normal no ponto (1, 2, −7/5).
Exercı́cio 2.2.14 Calcule as derivadas parciais de primeira ordem de

1. f (x, y, z) = x2 + y 2 + z 2
2. f (x, y) = sen(sen(sen(sen(x + y))))
R x+y −s2
3. f (x, y) = 0 e ds
∂f
Exercı́cio 2.2.15 Seja f (x, y) = y sen(x2 + arctg(y − cos(x))) + 2. Calcule ∂x (0, 0).
Exercı́cio 2.2.16 Moste que as seguintes funções são diferenciáveis e calcule as suas derivadas:
1. f (x, y) = (x2 + y, x − y)
Ry Rx
2. f (x, y) = (x 0 ecos(s) ds, y 0 ecos(s) ds)
Exercı́cio 2.2.17 Calcule a derivada de f ◦ g nos seguintes casos:

1. f (x, y, z) = x2 + y 2 + z 2 e g(t) = (sen(t), cos(t), 0);
2. f (x, y) = (x + y, x − y) e g(u, v) = (v, u);
2
+y 2 )
3. f (x, y, z, w) = cos(e(x − z − w) e g(p, q) = (0, 1, 2, 3).
2.2.14
∂f
a) ∂x = 2x, ∂f ∂f
∂y = 2y e ∂z = 2z. Observe que o vector (2x, 2y, 2z) é ortogonal à fronteira
das bolas centradas em 0, isto é às esferas de equação da forma x2 + y 2 + z 2 = c. Isto não
é uma coincidência mas sim uma consequência do que foi aflorado no exercı́cio 2.2.10 e que
retomaremos!
∂f ∂f
b) ∂x = ∂y = cos(sen(sen(sen(x + y)))) cos(sen(sen(x + y))) cos(sen(x + y)) cos(x + y);
∂f ∂f 2
c) ∂x = ∂y = e−(x+y) (observe que não é necessário calcular o integral).
J
2.2.15 Observe que f (x, 0) = 2. J
2.2.16 Ambas as funções são de classe C 1 , pois as derivadas parciais são contı́nuas. Portanto:

2x 1
1. Df = .
1 −1
R y cos(s)
ds R xecos(y)

e
2. Df = 0 cos(x) x cos(s)
ye 0
e ds
J
2.2.17
2.3. DERIVADAS PARCIAIS DE ORDEM SUPERIOR À PRIMEIRA
1. Observe que (f ◦ g)(t) = 1 para qualquer t.
2. Pela regra da cadeia temos:

1 1 0 1 1 −1
D(f ◦ g) = Df Dg = = .
1 −1 1 0 1 1
3. Note que Dg = 0 pelo que D(f ◦ g) = 0.
2.3 Derivadas parciais de ordem superior à primeira

Vamos considerar com derivadas parciais de ordem superior à primeira que, no essencial, se definem
recursivamente.
Definição 2.3.1 Seja f : Rn → R. As derivadas parciais de segunda ordem, com respeito a xi e

xj , 1 ≤ i, j ≤ n, são definidas por
∂2f ∂ ∂f
= ,
∂xi ∂xj ∂xi ∂xj
∂2f ∂2f
caso a expressão da direita esteja definida. Se i = j escreve-se ∂xi ∂xi = ∂x2i
. Procede-se de modo
análogo para derivadas parciais de ordem superior à segunda.
Exemplo 2.3.1 Uma notação como

∂4u
∂x∂y 2 ∂z
indica que a função u foi derivada sucessivamente em ordem à variável z, duas vezes em ordem a
y e finalmente em ordem a x.
Exemplo 2.3.2 Seja f (x, y) = x2 + 2y 2 + xy. Temos
∂2f

∂ ∂f ∂
= = (4y + x) = 1.
∂x∂y ∂x ∂y ∂x
Exemplo 2.3.3 Seja f (x, y, z) = sen(x + y + z)
∂5f ∂4 ∂3
= (cos(x + y + z)) = − (sen(x + y + z)) =
∂x2 ∂y∂z∂y ∂x2 ∂y∂z ∂x2 ∂y
∂2 ∂
= − 2 (cos(x + y + z)) = (sen(x + y + z)) = cos(x + y + z).
∂x ∂x
∂2f
Exercı́cio 2.3.1 Seja f (x, y) = x2 + 2y 2 + xy. Calcule ∂y∂x ; observe que o resultado é o mesmo
do exemplo 2.3.2.
O resultado deste último exercı́cio ser o mesmo do exemplo 2.3.2 não é uma coincidência mas
sim a consequência de um facto mais geral — o Teorema de Schwarz. Antes de o enunciarmos
precisamos de uma definição:
Definição 2.3.2 Considere uma função f : U ⊂ Rn → R.
• Se U for aberto diz-se que f é de classe C k em U , k ∈ N, ou abreviadamente f ∈ C k (U ), se

todas as derivadas parciais de ordem k de f existirem e forem contı́nuas em U .
y +k
x x +h x
Figura 2.2: Convenções na demonstração da Proposição 2.2.2 e do Teorema 2.3.1.
• Se U não for aberto escrevemos f ∈ C k (U ), k ∈ N, se existir V aberto com V ⊃ U e uma

função g ∈ C k (V ) tal que a restrição de g a U seja igual a f .
• f diz-se de classe C 0 (U ) se for contı́nua em U .
• Adicionalmente, para U aberto, definimos C ∞ (U ) = ∩k∈N C k (U ) e para um conjunto não

necessariamente aberto procedemos como anteriormente.
Na maior parte das aplicações do cálculo diferencial a hipótese de uma função ser de classe C k
para um certo k é natural. Certos resultados a citar a seguir serão válidos sob hipóteses mais gerais
mas abstermo-nos-emos de dar importância especial a tais hipóteses. Por vezes serão remetidas
para problemas.
Exercı́cio 2.3.2 Seja p(x1 , . . . xn ) um polinómio em n variáveis. Mostre que sen(p(x1 , . . . xn )) é

uma função C ∞ (Rn ).
Problema 2.3.1 Verifique que se j < k então C k ⊂ C j .
O próximo teorema é um resultado muito importante que permite reduzir o número de cálculos
necessários para determinar as derivadas parciais de ordem superior á primeira. Ele diz-nos que,
sob certas condições, a ordem pela qual se deriva uma função é irrelevante.
Teorema 2.3.1 (Schwarz)

∂2f ∂2f
Seja f : U ⊂ Rn → R, a um ponto interior a U , f ∈ C 2 (U ). Então ∂xi ∂xj (a) = ∂xj ∂xi (a) para
quaisquer ı́ndices 1 ≤ i, j ≤ n.
Ideia da demonstração. Basta considerar n = 2 e convencionamos a = (x, y). Notamos que
∂2f [f (x + h, y + k) − f (x + h, y)] − [f (x, y + k) − f (x, y)]

(x, y) = lim lim (2.3)
∂x∂y h→0 k→0 hk
∂2f [f (x + h, y + k) − f (x, y + k)] − [f (x + h, y) − f (x, y)]
(x, y) = lim lim (2.4)
∂y∂x k→0 h→0 hk
Designemos o numerador das fracções dos segundos membros de (2.3-2.4) por D(h, k). Aplicando
o teorema de Lagrange à função g(t) = f (x + t, y + k) − f (x + t, y) no intervalo [0, h] obtemos que
2.3. DERIVADAS PARCIAIS DE ORDEM SUPERIOR À PRIMEIRA
existe θ1 , 0 < θ1 < 1, tal que

∂f ∂f
D(h, k) = h (x + θ1 h, y + k) − (x + θ1 h, y) .
∂x ∂x
Uma segunda aplicação do teorema de Lagrange permite obter que existe θ2 , 0 < θ2 < 1, tal que
∂2f
D(h, k) = hk (x + θ1 h, y + θ2 k).
∂y∂x
Substituição em (2.3) e justificação de que ambos os limites iterados igualam lim(h,k)→(0,0) D(h, k)
permitem obter a igualdade pretendida.
Problema 2.3.2 O último passo da demonstração da Proposição 2.3.1 merece alguns comentári-
os. Por um lado θ1 e θ2 são funções de h e k. Por outro a relação entre um limite e um limite
iterado é, em geral, mais complexa do que o leitor pode imaginar. Seja f : U ⊂ R2 → R e (x0 , y0 )
um ponto interior de U . Mostre que:
a) Pode existir lim(x,y)→(x0 ,y0 ) f (x, y) sem que exista limx→x0 limy→y0 f (x, y).
b) Se lim(x,y)→(x0 ,y0 ) f (x, y) e limx→x0 limy→y0 f (x, y) existirem então são iguais.
Problema 2.3.3 É óbvio da demonstração da Proposição 2.3.1 que a hipótese f ∈ C 2 pode ser
aligeirada. Isto pode ser feito de várias formas. Formule e demonstre pelo menos dois resultados
deste tipo com hipóteses “mı́nimas” não equivalentes.
Exemplo 2.3.4 Seja f = 2xy. f é de classe C 2 uma vez que é um polinómio, portanto temos a
seguinte igualdade
∂2f ∂2f
= =2
∂x∂y ∂y∂x
Exemplo 2.3.5 Se f é de classe C 3 têm-se as seguintes igualdades:
∂3f ∂3f ∂3f

= =
∂x2 ∂y ∂x∂y∂x ∂y∂x2
e
∂3f ∂3f ∂3f
2
= = .
∂y ∂x ∂y∂x∂y ∂x∂y 2
Exercı́cio 2.3.3 Calcule as derivadas de todas as ordens de f (x, y, z) = 2x3 z+xyz+x+z (observe
que só há um número finito de derivadas não nulas. Porquê?).
O conceito de derivada dirigida de ordem superior à primeira permite formalizar o enunciado da

fórmula de Taylor de uma forma análoga ao resultado já conhecido para funções reais de variável
real.
Definição 2.3.3 Seja f : U ⊂ Rn → R. As derivadas dirigidas de ordem superior à primeira de

(1)
f num ponto x ∈ U segundo h definem-se recursivamente, se existirem, por Dh f (x) = Dh f (x)
e
(j) (j−1)
Dh f (x) = Dh (Dh f (x)), se j > 1.
Relembra-se que para funções diferenciáveis, e em particular de classe C 1 , temos Dh f (x) =

h · ∇f (x).
Problema 2.3.4 Verifique que para funções de classe C j num aberto o cálculo da derivada diri-
(j) j
gida Dh f corresponde a aplicar à função f o operador diferencial (h · ∇) e consequentemente
(j)
Dh f é um polinómio homogéneo5 de grau j nas componentes do vector h. Se h = (h1 , h2 )
verifique que para n = 2 e j = 2 temos
(2) ∂2f ∂2f ∂2f

Dh f = h21 2 + 2h1 h2 + h22 2 .
∂x1 ∂x1 ∂x2 ∂x2
Em geral obtenha
n n
(j)
X X ∂j f
Dh f = ··· hi1 . . . h ij .
i1 =1 ij =1
∂xi1 . . . ∂xij
Note que existem termos “repetidos” na fórmula anterior. Calcular o número de repetições é
um problema de cálculo combinatório cuja solução no caso n = 2 é bem conhecida.

Exercı́cio 2.3.4 Seja f : R2 → R definida por:
(
xy, se |y| > |x|,
f (x, y) =
0, caso contrário.
Mostre que:
∂2f ∂2f
(0, 0) = 0 (0, 0) = 1.
∂x∂y ∂y∂x
Explique porque é que isto não contradiz o teorema 2.3.1.
Exercı́cio 2.3.5 Seja f : R2 → R uma função limitada (não necessariamente contı́nua). Mostre
que
g(x, y) = x + y + (x2 + y 2 )f (x, y)
é diferenciável na origem. Calcule a sua derivada. Dê um exemplo de uma função f tal que g não
seja contı́nua no complementar da origem.
Exercı́cio 2.3.6 Suponha f : Rn → Rn , f bijectiva, diferenciável e f −1 também diferenciável.

−1
Mostre que Df −1 (f (x)) = [Df (x)] . Use esta observação para, por exemplo, rededuzir a fórmula
da derivada de arcsen.
2.3.4 O teorema 2.3.1 só se aplicaria se a função f fosse de classe C 2 . J

2.3.5 Use a definição de derivada para mostrar que g é diferenciável com derivada representada
por ∇g(0, 0) = (1, 1). Para a segunda parte um exemplo possı́vel é
(
1, se x ∈ Q,
f (x, y) =
0, caso contrário.
J
−1 d 1
2.3.6 Observe que f (f (x)) = x. Diferencie esta expressão. dy (arcsen y) =√ . J
1−y 2
5 Um polinómio P de grau k diz-se homogéneo se P (λx) = λk P (x) para todo o λ ∈ R.
2.4. POLINÓMIO DE TAYLOR
2.4 Polinómio de Taylor

Tal como no caso de funções reais de variável real podemos construir aproximações polinomiais de
funções de classe C k .
Teorema 2.4.1 (Taylor)

Seja f : U ⊂ Rn → R uma função de classe C k (U ) com U um aberto e x0 ∈ U . Para cada j ≤ k
existe um polinómio em n variáveis de grau j, único, Pj : Rn → R tal que
f (x) − Pj (x)
lim j
= 0. (2.5)
x→x0 |x − x0 |
O polinómio Pj é designado por polinómio de Taylor de ordem j de f relativo ao ponto x0 e é

dado por
j
X 1 (l)
Pj (x) = f (x0 ) + D f (x0 ). (2.6)
l! x−x0
l=1
O erro Ej (x) da fórmula de Taylor é dado por
Ej (x) = f (x) − Pj (x).
Ideia da demonstração. Decorre do resultado já conhecido para n = 1 e do teorema de derivação

da função composta por consideração da função auxiliar g : [0, 1] → R definida por g(t) = f (t(x −
x0 ) + x0 ) em que x ∈ Br (x0 ) ⊂ U .
Problema 2.4.1 Use o problema 2.3.4 para obter a fórmula de Taylor na forma:
k
X X 1 ∂pf
f (x) = i1 in
(x0 ) (x1 − x01 )i1 . . . (xn − x0n )in + Ek (x − x0 ). (2.7)
p=0 i1 +...+in =p
p! ∂y 1 . . . ∂yn
O leitor é aconselhado a pensar no polinómio de Taylor via a propriedade (2.5) e não simples-
mente como um polinómio calculável via (2.6) ou (2.7).
Problema 2.4.2 Formule o Teorema de Taylor explicitando o resto da fórmula de Taylor numa
forma análoga a uma das conhecidas para funções reais de variável real.
Poderá pensar-se que o cálculo do polinómio de Taylor para funções de várias variáveis e
para uma ordem relativamente elevada é um pesadelo computacional. Nem sempre será assim se
tirarmos partido, quando possı́vel, de resultados já conhecidos para funções de uma variável.
Frequentemente em vez de escrevermos o termo de erro Ek (x − y), escrevemos o(kx − ykk ),
com o mesmo significado.
Exemplo 2.4.1 Se f (x, y) = xy + sen x, a fórmula de Taylor de segunda ordem em torno de

(π, 0) é:
1 ∂ 2 f

∂f ∂f
f (x, y) =f (π, 0) + (x − π) + y++ (x − π)2
∂x (π,0) ∂y (π,0) 2 ∂x2 (π,0)
∂ 2 f 1 ∂ 2 f

+ (x − π)y + y 2 + o(k(x − π, y)k2 ),
∂x∂y (π,0) 2 ∂y 2 (π,0)
ou seja
f (x, y) = π − x + xy + o(k(x − π, y)k2 ).
Exemplo 2.4.2 Se f (x, y) = x2 + 2xy + y 2 então a sua expansão em fórmula de Taylor até à
segunda ordem, em torno de qualquer ponto, é x2 +2xy+y 2 . Com efeito, f (x, y)−x2 +2xy+y 2 = 0
pelo que (2.8) vale. Repare que isto evitou termos de calcular 5 derivadas!
Exercı́cio 2.4.1 Calcule a fórmula de Taylor até à terceira ordem das seguintes funções:
1. f (x, y, z) = x + y 2 + z;
2. f (x, y, z) = 1 + x + y + z + xy + xz + yz + xyz;
3. f (x, y) = ex + xyz.
Exercı́cio 2.4.2 Mostre que a fórmula de Taylor de ordem k para um polinómio de grau k coincide
com o polinómio.
Exercı́cio 2.4.3 Demonstre a parte correspondente a unicidade do teorema de Taylor. [Suponha

que existe um polinómio p(x) para o qual (2.8) vale. Mostre que se existisse outro polinómio
q(x) 6= p(x), de grau menor ou igual ao grau de p obterı́amos uma contradição.]
Em certos casos podemos utilizar o conhecimento da expansão em potências de uma função
real de variável real para calcularmos a expansão em potências de expressões mais complicadas:
Exemplo 2.4.3 Queremos calcular a expansão de Taylor da função sen(x2 + y 4 ) até à ordem 6
em torno da origem. Sabemos que
t3
sen t = t − + o(|t|3 ).
6
Deste modo temos
(x2 + y 4 )3
sen(x2 + y 4 ) = x2 + y 4 − + o((x2 + y 4 )3 )
6
pelo que
x6
sen(x2 + y 4 ) = x2 + y 4 − + o(k(x, y)k6 ),
6
em que na última igualdade tivemos em atenção que (x2 + y 4 )3 = x6 + 3x4 y 4 + 3x2 y 8 + y 12 =
x6 + o(k(x, y)k6 ) e x2 + y 4 ≤ x2 + y 2 para k(x, y)k suficientemente pequeno.
Exemplo 2.4.4 Seja

g(x, y) = sen(x2 − y 2 ).
e suponhamos que pretendemos obter o polinómio de Taylor de sétima ordem de g relativo a (0, 0).
Sabemos que o seno é uma função inteira cuja série de Taylor relativa a 0 (série de Mac
Laurin) é
λ3 λ5 k+1 λ
2k−1
sen λ = λ − + − · · · + (−1) + ...
3! 5! (2k − 1)!
Tal permite-nos ter um palpite àcerca do polinómio de Taylor pretendido simplesmente por substi-
tuição formal de λ por x2 − y 2 na igualdade anterior e só considerando os termos de grau menor
ou igual a sete. Obtem-se um polinómio
3
(x2 − y 2 )
Q(x, y) = (x2 − y 2 ) −
3!
Resta provar que efectivamente se trata do polinómio de Taylor pretendido. Para tal usa-se a
caracterização (2.5) do polinómio de Taylor. De facto
λ3
sen λ − λ + 3!
lim =0
λ→0 λ4
2.4. POLINÓMIO DE TAYLOR
donde resulta
g(x, y) − Q(x, y)
lim 4 =0
(x,y)→(0,0) (x2 − y 2 )
e usando |x2 − y 2 | ≤ x2 + y 2 obtém-se
g(x, y) − Q(x, y)
lim 4 = 0.
(x,y)→(0,0) (x2 + y 2 )
Assim Q é de facto o polinómio de Taylor pretendido e inclusivamente é idêntico ao polinómio

de Taylor de oitava ordem. Note que obtivemos, por exemplo, que todas as derivadas parciais de
ordens 1, 3, 4, 5, 7 e 8 de g em (0, 0) são nulas.
2 2
Exercı́cio 2.4.4 Desenvolva em fórmula de Taylor f (x, y) = ex +y até à terceira ordem. Tente
não calcular as derivadas directamente mas sim usar o facto de que o polinómio de Taylor de
ordem k é o único polinómio de grau ≤ k tal que
|f (x) − p(x)|
lim = 0. (2.8)
kx−yk→0 kx − ykk
Exercı́cio 2.4.5 Calcule a expansão em potências de x − 1 e y − 2 de
sen(x + y − 3)
até à quarta ordem.

Exercı́cio 2.4.6 Calcule a expansão de Taylor em torno do ponto (1, 1, 1), até à quinta ordem de
xy + xyz + x2 + y 2 + xyz.
Rx
Exercı́cio 2.4.7 Seja f uma função C ∞ . Desenvolva 0
f (s)ds em série de Taylor em torno de
0.
2
+sen((y−1)2 )
Exercı́cio 2.4.8 Calcule a expansão em série de Taylor da função ex até à quarta
ordem em torno de x = 0 e y = 1.
Exercı́cio 2.4.9 Calcule a expansão em série de Taylor de
sen x1000 + y 1000 + z 1000

até à ordem 999 em torno da origem.
Exercı́cio 2.4.10 Suponha que f : R → R e v : R2 → R são de classe C ∞ e satisfazem

( 2
∂v ∂ v
= ∂x
∂t 2
v(x, 0) = f (x).
Desenvolva v em série de Taylor em torno da origem.
2.4.6 Neste caso a fórmula de Taylor coincide com o próprio polinómio xy + xyz + x2 + y 2 + xyz
(veja o teorema 2.4.1). J
Rx 0 x2 (n−1) xn
2.4.7 0 f (s)ds = f (0)x + f (0) 2 + . . . + f (0) n! + . . .. J
6
t2
2.4.8 Note que sen((y − 1)2 ) = (y − 1)2 + (y−1)
6 + o(|y − 1|6 ) e que et = 1 + t + 2 + o(t3 ) pelo
2 2 2
que ex +sen((y−1) ) = 1 + x2 + (y − 1)2 + x2 + (y − 1)2 + o(k(x, y − 1)k4 ). J
2.4.9 Repare que sen(t) = t + o(t2 ) para t numa vizinhança da origem. J
∂v ∂2f ∂2v ∂3f
2.4.10 Note que, utilizando a equação, se tem ∂t (0, 0) = ∂x2 (0), ∂t∂x (0, 0) = ∂x3 (0). Use o
método de indução. J
Capı́tulo 3
Extremos
Problemas envolvendo maximização ou minimização de funções envolvendo diversos parâmetros

estão entre os mais importantes em Matemática. Aparecem frequentemente em fı́sica (por exemplo
a mecânica lagrangeana), engenharia (maximizar a resistência de um mecanismo ou eficiência
de um motor) ou economia (minimizar custos de produção ou optimizar investimentos). Neste
capı́tulo vamos estudar métodos para determinar máximos e mı́nimos de funções definidas em
subconjuntos de Rn com valores em R.
O leitor já deve conhecer que, para funções reais de variável real, os candidatos a pontos de
extremo de entre os pontos interiores onde a função é diferenciável são exactamente aqueles onde a
derivada se anula, chamados pontos de estacionaridade. A generalização deste facto para funções
de mais de uma variável, a discutir mais à frente, são os pontos onde o gradiente da função se
anula. Tal condição estabelece o chamado sistema de estacionaridade cujas soluções serão ainda
conhecidas por pontos de estacionaridade.
O teorema de Taylor será utilizado para a classificação de pontos de estacionaridade de uma
função de classe C 2 quanto a serem pontos de mı́nimo, máximo ou pontos de sela. Quanto a
este último ponto é de notar que, num caso concreto, os critérios baseados na fórmula de Taylor
poderão ser insuficientes por diversas razões e tal é abundantemente exemplificado nos exercı́cios1
• Uma função pode ter um extremo num ponto onde não estão definidas algumas das derivadas
parciais de primeira ordem.
• Uma função pode ter um extremo num ponto fronteiro do seu domı́nio.
• Uma função pode ter um extremo num ponto de estacionaridade não sendo de classe C 2
numa qualquer vizinhança desse ponto.
• Os critérios baseados na fórmula de Taylor podem ser inconclusivos.
Adicionalmente tais métodos pressupõem que o sistema de estacionaridade da função é expli-

citamente resolúvel o que, dado a sua não linearidade, é algo que em geral não se verificará.
Em tais casos uma sistematização de todos os possı́veis métodos de ataque ao problema de
determinação dos pontos de extremo local de uma função é impossı́vel. Cremos no entanto que os
raciocı́nios mais interessantes estão bem exemplificados a seguir.
Alguns dos métodos a utilizar pressupõem alguns conhecimentos de Álgebra Linear. Como
referência sugere-se [4].
1 Exemplos tı́picos para reais de variável real com o domı́nio da função o intervalo [−1, 1]: x 7→ |x|,
( funções
e−1/x2 se x 6= 0,
x 7→ x, x 7→ |x|3/2 , x 7→
0 caso contrário.
27
CAPÍTULO 3. EXTREMOS
0.2 0.3
0.2
0.1
0.1
-1.5 -1 -0.5 0.5 1 1.5 -2 -1 1 2
-0.1
-0.1
-0.2
−x2 +x4 x3
Figura 3.1: Os gráficos de f (x) = 4
− 6
e g(x) = x4 − x2 .
3.1 Extremos
Provavelmente o leitor terá uma ideia intuitiva do que é um ponto de extremo de uma função, ou
seja, um ponto de máximo ou de mı́nimo. Começaremos portanto por formalizar estas ideias do
ponto de vista matemático. A primeira definição é a de máximo e mı́nimo local de uma função
real.
Definição 3.1.1 Seja f : A → R, com A ⊂ Rn . Um ponto x0 ∈ A é um ponto de máximo (resp.

mı́nimo) local e f (x0 ) máximo (resp. mı́nimo) local de f se existir uma vizinhança2 V de x0 tal
que , ∀x ∈ V ∩ A,
f (x) ≤ f (x0 ), (resp. f (x) ≥ f (x0 )).
Note que, de acordo com a definição anterior, uma função pode ter vários extremos locais cada
um deles ocorrendo em vários pontos de extremo local.
Exemplo 3.1.1 Seja f a função definida em R, constante igual a 1. Então qualquer número real
é um ponto de máximo (e também mı́nimo) de f .
O último exemplo ilustra a necessidade de distinguir estes casos degenerados de outros mais inte-
ressantes. Assim temos a seguinte definição.
Definição 3.1.2 O máximo (resp. mı́nimo) é estrito se a igualdade na definição anterior só se
verificar para x = x0 . O máximo (resp. mı́nimo) é global (ou absoluto) se, ∀x ∈ A
f (x) ≤ f (x0 ), (resp. f (x) ≥ f (x0 )).
2 4 3
Exemplo 3.1.2 A função f (x) = −x 4+x − x6 tem um máximo local em x = 0, um mı́nimo local
em x = − 21 e um mı́nimo absoluto em x = 1, como se pode observar na figura 3.1. A função
g(x) = x4 − x2 tem um mı́nimo absoluto para x = 1. No entanto, este mı́nimo não é único pois
x = −1 é outro ponto de mı́nimo absoluto tendo-se g(1) = g(−1). Veja a figura 3.1.
Exemplo 3.1.3 Provemos que a função f (x) = x2 tem um mı́nimo absoluto estrito na origem.
Tal decorre de f (0) = 0 < x2 = f (x) para x 6= 0.
Exercı́cio 3.1.1 Seja f : A → R, com A = {a}, o conjunto só com um ponto. Justifique que
x = a é ponto de mı́nimo e ponto de máximo estrito simultaneamente.
Nem sempre dada uma função podemos garantir a existência de máximos ou mı́nimos, como
se pode ver pelos exemplos seguintes:
2 Por exemplo, uma bola de raio centrada em x0 .
3.1. EXTREMOS
7.5
2.5
-15 -10 -5 5 10 15
-2.5
-5
-7.5
x
Figura 3.2: O gráfico de f (x) = 2
+ sen x
Exemplo 3.1.4 Seja f : ]0, 1[ → R definida por f (x) = x. Note que f não tem mı́nimo nem
máximo pois não fazem parte do domı́nio os pontos 0 e 1 onde a função definida pela mesma
fórmula mas cujo domı́nio fosse o intervalo fechado [0, 1] atinge os seus valores extremos.
Exemplo 3.1.5 Seja f : R → R definida por f (x) = x2 + sen x. Embora f tenha máximos e
mı́nimos locais (ver figura 3.2) f não tem nenhum máximo ou mı́nimo global pois limx→+∞ f (x) =
+∞ e limx→−∞ f (x) = −∞.
Exemplo 3.1.6 Seja f (x) = x2 se x ∈ R \ {0}, f (0) = 1. Esta função não tem nenhum mı́nimo
pois f nunca se anula embora f tome valores positivos arbitrariamente pequenos.
Exercı́cio 3.1.2 Seja f a função do exemplo 3.1.6. Mostre que f (0) é um máximo local mas não
global.
Antes de prosseguirmos convém sumarizar informalmente o que aprendemos nos 3 últimos

exemplos. A função do exemplo 3.1.4 não tem máximo nem mı́nimo porque retirámos os extremos
a um intervalo limitado e fechado fazendo com que os valores extremos da função não sejam
atingidos nesses pontos. No exemplo seguinte não encontramos extremos absolutos pois a função
é ilimitada o que é possı́vel graças para uma função contı́nua se o domı́nio não é compacto (neste
caso não é limitado). Finalmente no último destes exemplos a função não tem mı́nimo porque
ocorre uma descontinuidade no ponto onde o mı́nimo deveria ocorrer.
Estes exemplos sugerem que, para garantir a existência de extremos, seja usual tentar lidar com
funções contı́nuas definidas em conjuntos limitados e fechados (compactos). O próximo teorema
mostra que estas condições são efectivamente suficientes para garantir a existência de extremos:
Teorema 3.1.1 (Weierstrass)

Seja f : A ⊂ Rn → R contı́nua com A compacto. Então f tem máximo e mı́nimo (globais) em A.
Ideia da demonstração.Veja o exercı́cio 2.1.16.

Ficamos assim com um critério abstracto para garantir a existência de máximos e mı́nimos, inde-
pendentemente da aparência mais ou menos complicada da definição da função:
sen(x+log(x+1))
Exemplo 3.1.7 A função f : [0, 1] → R dada por f (x) = e 1+100x2 é contı́nua e [0, 1].
Portanto tem pelo menos um ponto de máximo e um ponto de mı́nimo globais em [0, 1].
Exemplo 3.1.8 Consideremos o subconjunto K ⊂ R2 definido pela condição |x| + |y| ≤ 1. Seja
f a função aı́ definida por f (x, y) = x2 + y 2 . Como K é compacto (porque é limitado e fechado),
f tem de ter máximo e mı́nimo. Reparando que f é o quadrado da distância à origem concluı́mos
que ocorre um mı́nimo (global) na origem. Os pontos de máximo serão os pontos do conjunto mais
afastados da origem, que neste caso são (±1, 0) e (0, ±1).
z = f (x , y)
y0 y
x0
Figura 3.3: Fixar todas as variáveis excepto uma define uma função de uma variável. Se f tiver um
máximo local em (x0 , y0 ) e fixarmos a segunda variável em y0 então tal função tem um máximo em x0 .
Exercı́cio 3.1.3 Diga em quais dos seguintes subconjuntos de R2 pode garantir a existência de
mı́nimos para qualquer função contı́nua f . No caso de a resposta ser negativa apresente um
exemplo.
1. máx{|x|, |y|} = 1
2. máx{|x|, |y|} ≤ 1
3. máx{|x|, |y|} ≥ 1
4. máx{|x|, |y|} > 1
5. máx{|x|, |y|} < 1
Exercı́cio 3.1.4 Mostre que a função f (x) = x4 tem mı́nimo e não tem máximo no intervalo
] − 1, 1[. Porque é que isto não contradiz o teorema de Weierstrass?
Em casos simples é possı́vel seleccionar os candidatos a extremos utilizando raciocı́nios ad hoc.

No exemplo 3.1.8, a função em questão é a distância à origem e por isso tem um mı́nimo em 0. No
entanto, convém ter um critério, de aplicação fácil, que permita reduzir o número de candidatos a
pontos de máximo ou mı́nimo a serem analisados. O resultado do próximo teorema permite fazer
isto, daı́ a sua importância.
Definição 3.1.3 Seja f : A ⊂ Rn → R uma função diferenciável num ponto a ∈ int A. Diz-se
que a é um ponto de estacionaridade (ou ponto crı́tico) de f se ∇f (a) = 0.
Teorema 3.1.2
Seja f : A ⊂ Rn → R uma função diferenciável num ponto x ∈ int A. Se x é ponto de extremo de
f então é ponto de estacionaridade, ou seja ∇f (x) = 0.
Ideia da demonstração. Seja (x1 , . . . , xn ) um ponto de extremo duma função f e considere
gi (t) = f (x1 , . . . , t, . . . , xn ).
gi tem um extremo em t = xi . Aplique o resultado conhecido em dimensão 1 a gi no ponto xi .
3.1. EXTREMOS
Exemplo 3.1.9 Suponhamos que pretendemos encontrar os extremos da função f (x, y) = x2 + y 2

no conjunto x2 + y 2 < 1. Como o conjunto é aberto todos os pontos de extremo de f (se existirem)
serão interiores, pelo que nestes pontos o gradiente de f será nulo, isto é

∂f ∂f
∇f = , = (0, 0).
∂x ∂y
Deste modo, resolvendo a equação
∇f = (2x, 2y) = (0, 0),
podemos determinar todos os possı́veis extremos de f . Concluı́mos portanto, que o único ponto em
que pode ocorrer um extremo é (x, y) = (0, 0). Como f (0, 0) = 0 e a função é sempre positiva em
todos os outros pontos este será necessariamente um mı́nimo (absoluto) de f .
O teorema anterior e o teorema de Weierstrass implicam um critério de detecção de pontos de
extremo que sumarizamos no seguinte corolário:
Corolário 3.1.3
Seja f : A → R, A compacto (limitado e fechado) e f contı́nua. Então f tem pelo menos um
ponto de máximo e um ponto de mı́nimo global. Para além disso, os únicos pontos que podem ser
extremos de f são
1. pontos na fronteira de A;
2. pontos onde ∇f = 0;
3. pontos onde f não é diferenciável.
Exercı́cio 3.1.5 Determine (se existirem) os máximos e mı́nimos das seguintes funções:
1. f (x, y) = x4 + y 4 em |x| + y 2 < 1.
2. f (x, y) = x2 − y 2 no conjunto x2 + y 2 < 1.
3. f (x, y) = xy em |x| + |y| < 1.
p
4. f (x, y) = x2 + y 2 em x2 + y 2 < 1.
Porém nem todos os pontos crı́ticos de uma função são máximos ou mı́nimos. Isto motiva a
seguinte definição:
Definição 3.1.4 Diz-se que um ponto de estacionaridade a é um ponto de sela de uma função
f se qualquer que seja a vizinhança de a existirem pontos nessa vizinhança onde a função toma
valores inferiores e superiores a f (a).
Exemplo 3.1.10 Seja f (x) = x3 então 0 é um ponto de sela de f pois embora seja um ponto
crı́tico de f (f 0 (x) = 3x2 anula-se na origem) não se trata de um ponto de máximo ou mı́nimo
(porque f (x) < f (0) para x < 0 e f (x) > f (0) para x > 0).
Exercı́cio 3.1.6 Verifique que (0, 0) é um ponto de sela3 de x2 − y 2 .

No exemplo 3.1.9 e no exercı́cio 3.1.5 os conjuntos onde as funções estavam definidas eram
abertos. Consequentemente todos os pontos de extremo eram pontos de estacionaridade. Não é
este o caso do próximo exemplo, onde nos temos de preocupar com a possibilidade de haver máxi-
mos ou mı́nimos que, por estarem na fronteira do domı́nio, não sejam pontos de estacionaridade.
3 A expressão ponto de sela é motivada pelos gráficos de funçãoes em exemplos como este. Claro que acabamos
por usar a expressão em situações mais gerais.
Exemplo 3.1.11 Suponhamos que queremos determinar os extremos da função
f (x, y) = xy(1 − x2 − y 2 )
no quadrado [−1, 1] × [−1, 1].

O gradiente de f é dado por
∇f = (y(1 − x2 − y 2 ) − 2x2 y, x(1 − x2 − y 2 ) − 2xy 2 ).
Os pontos de estacionaridade estarão entre as soluções de

(
y − 3x2 y − y 3 = 0
(3.1)
x − 3xy 2 − x3 = 0
no interior do quadrado, isto é, verificando simultaneamente −1 < x < 1 e −1 < y < 1. O sistema
(3.1) admite como soluções:
1. (x, y) = (0, 0);
2. x = 0, y 6= 0 e portanto 1 − y 2 = 0, ou seja (x, y) = (0, ±1);
3. x 6= 0, y = 0 e portanto 1 − x2 = 0, ou seja (x, y) = (±1, 0);
4. pontos que verifiquem x 6= 0, y 6= 0 e

(
3x2 + y 2 = 1
(3.2)
x2 + 3y 2 = 1.
O sistema 3.2 não é linear em (x, y) mas é linear em (x2 , y 2 ) e tem como solução
1 1
x2 = y2 = .
4 4
Deste modo (1/2, 1/2), (−1/2, 1/2), (1/2, −1/2) e (−1/2, −1/2) satisfazem o sistema de estacio-
naridade.
De entre as soluções de (3.1) as que são pontos interiores do domı́nio fornecem a lista de possı́-
veis candidatos a extremos locais em pontos interiores: (0, 0), (1/2, 1/2), (−1/2, 1/2), (1/2, −1/2)
e (−1/2, −1/2). Avaliando a função f nestes pontos obtemos f (0, 0) = f (±1, 0) = f (0, ±1) = 0,
f (±1/2, ±1/2) = 1/8 e f (±1/2, ∓1/2) = −1/8.
Para avaliar o que se passa sobre a fronteira do domı́nio consideramos f (−1, y) = y 3 para
y ∈ [−1, 1], f (1, y) = −y 3 para y ∈ [−1, 1], f (x, 1) = −x3 para x ∈ [−1, 1], f (x, −1) = x3 para
x ∈ [−1, 1]. Todas estas funções de uma variável real são estritamente monótonas de maneira
que basta considerar os valores da função nos vértices do quadrado: f (1, 1) = f (−1, −1) = −1 e
f (−1, 1) = f (1, −1) = 1.
Portanto (1, 1) e (−1, −1) são pontos de mı́nimo global e (1, −1) e (−1, 1) são pontos de máximo
global.
Temos agora de estudar o que acontece nos outros pontos pois podem ser máximos ou mı́nimos
locais ou apenas pontos de sela. Quanto ao ponto (0, 0) é fácil de verificar que xy assume valores
positivos e negativos numa vizinhança da origem. Por outro lado se (x, y) estiver suficientemente
próximo de (0, 0) a função 1 − x2 − y 2 é positiva. Portanto f numa vizinhança da origem assume
valores positivos e negativos. Logo (0, 0) é um ponto de sela.
Quanto ao ponto (1/2, 1/2) classificamo-lo usando um raciocı́nio ad hoc baseado na utilização
do teorema de Weierstrass. Note-se que (1/2, 1/2) é um ponto interior do conjunto compacto
A = {(x, y) ∈ R2 : x2 + y 2 ≤ 1, x ≥ 0, y ≥ 0}, que f vale 0 sobre ∂A e f > 0 no interior de A.
O teorema de Weierstrass garante que f terá um máximo em A (global relativamente a A) que
ocorrerá necessariamente num ponto interior. Tal ponto é então um ponto de estacionaridade. O
3.1. EXTREMOS
A
1/2
-1 1/2 1
0.2 1
0
0.5
-0.2
-1 0
-0.5
0 -0.5
-1
0.5
-1
1
Figura 3.4: Estudo de f (x, y) = xy(1 − x2 − y 2 ) quanto a existência de pontos de extremo em [−1, 1] ×
[−1, 1]. Tente identificar as propriedades deduzidas para a função com o que é evidenciado no gráfico
gerado numericamente à direita.
único ponto de estacionaridade em int A é (1/2, 1/2) logo este ponto é um ponto de máximo local de
f (relativamente ao quadrado [−1, 1] × [−1, 1]). Este raciocı́nio vale para (1/2, −1/2), (−1/2, 1/2)
e (−1/2, −1/2) chegando-se de maneira análoga à conclusão que (1/2, −1/2), (−1/2, 1/2) são
pontos de mı́nimo local e (−1/2, −1/2) um ponto de máximo local (ou use o facto de a função ser
ı́mpar em cada uma das variáveis).
Exercı́cio 3.1.7 Determine, se existirem, os pontos de máximo e mı́nimo local da função (x, y) 7→
xy no quadrado máx{|x|, |y|} ≤ 1.
Para terminar esta secção vamos apresentar um exemplo em que usamos propriedades de
simetria e uma mudança de variável para determinar extremos
Exemplo 3.1.12 Seja f (x, y, z, w) = x2 + y 2 − z 2 − w2 + (x2 + y 2 )2 . Definindo r12 = x2 + y 2 e

r22 = z 2 + w2 temos f (x, y, z, w) = r12 − r22 + r14 . Portanto, determinando os máximos e mı́nimos
de g(r1 , r2 ) = r12 − r22 + r14 , podemos recuperar os máximos e mı́nimos de f .
Exercı́cio 3.1.8 Determine os extremos de g(r1 , r2 ) = r12 − r22 + r14 . Utilize este resultado para
calcular os extremos de f (x, y, z, w) = x2 + y 2 − z 2 − w2 + (x2 + y 2 )2 .

Exercı́cio 3.1.9 Determine os pontos de extremo de:
1. f (x, y, z) = x2 + y 2 + z 2 com |x| + |y| + |z| ≤ 1.
2. f (x, y) = x + y com x2 + y 2 ≤ 1.
3. f (x, y) = x2 + y 2 − (x2 + y 2 )2 .
4. f (x, y) = x3 y 3 (1 − x6 − y 6 ) para (x, y) ∈ [−1, 1] × [−1, 1].
Exercı́cio 3.1.10 Seja f : R → R, contı́nua, satisfazendo
lim f (x) = +∞.

x→±∞
Prove que f tem pelo menos um mı́nimo.
Exercı́cio 3.1.11 (Mı́nimos quadrados) O método dos mı́nimos quadrados tem como objectivo
determinar a recta y = ax + b que “melhor aproxima” certos dados experimentais (xi , yi ), com
1 ≤ i ≤ n. Uma função que permite medir quanto é que uma dada recta na forma y = ax + b
aproxima os pontos experimentais é
n
X
g(a, b) = (axi + b − yi )2 .
i=1
Calcule os pontos de estacionariade de g para determinar que equações é que a e b satisfazem

(a prova de que o ponto de estacionaridade é mesmo um mı́nimo é deixada para um exercı́cio
posterior).

3.1.9
1. Note que f é o quadrado da distância à origem.
2. Como f não tem pontos de estacionaridade em x2 + y 2 < 1 os seus extremos (que existem
pelo teorema de Weirstrass) têm de se encontrar na fronteira. Escreva os pontos da fronteira
com x = cos(θ) e y = sen(θ). Determine os extremos de cos(θ) + sen(θ) com θ ∈ [0, 2π].
3. Determine os extremos de r2 − r4 com r ≥ 0. Faça r2 = x2 + y 2 .
4. Recorde o exemplo 3.1.11 substituindo x ↔ x3 e y ↔ y 3 .
J
3.1.10 Utilize o teorema do valor médio. J
3.1.11 Se g tiver mı́nimo em (a, b) verifica-se ∇g = 0. Portanto a e b satisfazem as equações
Pn Pn Pn
x2i

Pi=1 i=1 xi a
= i=1 xi yi
.
n P n
i=1 xi n b i=1 yi
3.2 Testes de Segunda Ordem

Nesta secção vamos estudar um método que permite classificar os pontos de estacionaridade de
funções. No caso unidimensional, quando a segunda derivada não se anula, um ponto de estaciona-
ridade de uma função é de máximo ou de mı́nimo dependendo do sinal da segunda derivada. Para
funções f de Rn em R a segunda derivada de f é representada por uma forma blinear definida por
uma matriz chamada hessiana. Classificando a forma quadrática definida pela hessiana quanto a
ser definida positiva, negativa, indefinida, semidefinida,. . . , ou de forma equivalente determinando
o sinal dos seus valores próprios, é possı́vel estudar a classificação de pontos de estacionaridade
quanto a serem pontos de máximo ou mı́nimo. À semelhança do caso unidimensional quando a
derivada é nula, este teste pode não ser conclusivo se a forma quadrática for semidefinida, isto é
todos os valores próprios tiverem o mesmo sinal excepto alguns nulos.
Comecemos por precisar alguns dos termos usados no parágrafo anterior.
3.2. TESTES DE SEGUNDA ORDEM
Definição 3.2.1 Seja A uma matriz simétrica, ou seja A = AT e considere-se a forma quadrática
QA definida por A via QA (x) = x · Ax para x ∈ Rn .
1. Diz-se que A é definida positiva (resp. negativa) se a forma quadrática QA for defininida
positiva (resp. negativa), isto é, QA (x) > 0 (resp. QA (x) < 0) para todo o x ∈ Rn \ {0}.
2. Diz-se que A é semi-definida positiva4 (resp. negativa) se a forma quadrática QA for semi-
defininida positiva (resp. negativa), isto é, QA (x) ≥ 0 (resp. QA (x) ≤ 0) para todo o x ∈ Rn
e existe algum y 6= 0 tal que QA (y) = 0.
3. Caso nenhuma destas situações se verifique diz-se que a matriz é indefinida esta situação
corresponde a QA ser indefinida, isto é, existirem y, z ∈ Rn tais que QA (y) < 0 e QA (z) > 0.
A definição anterior poderia ter sido feita em termos de valores próprios (consultar por exemplo
[4] ou resolver o exercı́cio 3.2.2) graças ao seguinte resultado básico de Álgebra Linear.
Seja QA uma forma quadrática definida por uma matriz simétrica A via QA (x) = x · Ax para
x ∈ Rn . Então:
1. QA é definida positiva (resp. negativa) se e só se todos os valores próprios de A forem
positivos (resp. negativos).
2. QA é semi-definida positiva (resp. negativa) se e só se todos os valores próprios de A forem
não negativos (resp. positivos) e pelo menos um nulo.
3. QA é indefinida se existir um valor próprio positivo e um valor próprio negativo.
Exemplo 3.2.1 Seja  

1 2 0
A = 2 4 0 .
0 0 1
Os valores próprios de A são definidos pela equação
 
1−λ 2 0
det(A − λI) =  2 4−λ 0  = λ(1 − λ)(5 − λ) = 0,
0 0 1−λ
que tem como soluções λ = 0, 1, 5. Portanto concluı́mos que A é semi-definida positiva.
Exercı́cio 3.2.1 Mostre que a única matriz simultaneamente semidefinida positiva e semidefinida
negativa é a matriz nula.
Que basta considerar matrizes simétricas ao lidar com formas quadráticas é uma das conclusões
do exercı́cio seguinte.
Exercı́cio 3.2.2 Em geral podemos definir forma quadrática QA associada a uma matriz A via
QA (x) = x · Ax.
T
1. Mostre que QA = QA] , onde A] = A+A 2 em que A] é chamada a simetrização de A.
Portanto substituir A pela sua simetrização não altera QA . Sugere-se que antes de provar o
caso geral, convença-se que este facto é verdadeiro com o exemplo

1 2
A= .
0 1
4 Esta definição de forma semidefinida não é a mesma de, por exemplo, [4] aonde uma forma ou matriz definida
é necessariamente semidefinida. Assim definida, indefinida e semidefinida são termos mutuamente exclusivos.
2. Demonstre a proposição 3.2.1.

Calcular valores próprios não é uma tarefa trivial e é conveniente dispor de critérios mais fáceis
de aplicar.
Seja
 
a11 ··· a1n
 .. .. 
A= . . 
an1 ··· ann
uma matriz n × n. Consideremos as submatrizes Ak que consistem nos elementos das primeiras k
linhas e k colunas de A, isto é,

a11 a12
A1 = a11 A2 = ···
a21 a22
Então,
1. A é definida positiva se e só se det Ai > 0 para todo o i.
2. A é definida negativa se e só se det Ai < 0 para i ı́mpar e det Ai > 0 para i par.

1 0 1
A = 0 2 0 .
1 0 4
Portanto
1 0
A1 = 1 A2 = A3 = A
0 2
e temos
det A1 = 1 det A2 = 2 det A3 = 6.
Como todos estes valores são positivos concluı́mos que A é definida positiva.
Exercı́cio 3.2.3 Prove a proposição para matrizes diagonais.

Para o caso de matrizes semi-definidas o critério é ligeiramente mais complexo. Dada uma
matriz A uma submatriz principal de A é qualquer matriz que se obtém de A suprimindo linhas
e colunas em pares correspondentes (e.g. a primeira e a terceira linhas e colunas).

1 2 3 4 5
6 7 8 9 10
 
11
A= 12 13 14 15

16 17 18 19 20
21 22 23 24 25
Suprimindo a primeira linha e primeira coluna obtemos a submatriz principal
 
7 8 9 10
12 13 14 15
 
17 18 19 20
22 23 24 25
Suprimindo a segunda e terceira linhas e colunas obtemos a submatriz principal
 
1 4 5
16 19 20 .
21 24 25
Uma matriz A é semi-definida positiva se e só se todas as submatrizes principais de A têm deter-
minantes não negativos e pelo menos um é nulo. Uma matriz A é semi-definida negativa se e só se
todas as submatrizes principais de A têm determinantes não negativos ou não positivos conforme
o número de linhas ou colunas da submatriz é par ou ı́mpar e pelo menos um é nulo.

0 0 0
A = 0 2 1 .
0 1 −5

Retirando a primeira e terceira linhas e colunas obtemos a submatriz 2 cujo determinante
é
positivo. Retirando a primeira e segunda linhas e colunas obtemos a submatriz −5 cujo determi-
nante é negativo. Portanto concluı́mos que a matriz não pode ser nem semidefinida positiva nem
semidefinida negativa pelo que é indefinida.

0 0 0
A = 0 2 1 .
0 1 5
O determinante de A é zero pelo que a matriz não pode ser nem definida positiva nem definida
negativa. O mesmo acontece ao determinante de qualquer submatriz obtida de A não retirando a
primeira linha e coluna. Portanto basta analisar 3 submatrizes; retirando a primeira e segunda
linhas e colunas obtemos a submatriz 5 cujo determinante é positivo; retirando a primeira e
terceira linhas e colunas obtemos a submatriz 2 cujo determinante é positivo; retirando a primeira
linha e coluna obtemos a submatriz
2 1
1 5
cujo determinante é 9 e portanto também positivo. Portanto concluı́mos que a matriz é semidefi-
nida positiva.
Exercı́cio 3.2.4 Classifique a matriz A dada por

 
3 0 0
A = 0 2 1
0 1 5
quanto a ser definida ou semidefinida positiva, negativa ou indefinida
Exercı́cio 3.2.5 Classifique a matriz A dada por

 
0 2 1
A = 0 2 1
0 1 5
quanto a ser definida ou semidefinida positiva, negativa ou indefinida
Depois destas definições preliminares vamos definir a matriz hessiana5 .
Definição 3.2.2 Seja f : Rn → R de classe C 2 . A matriz hessiana de f , H(f ), é dada por

 ∂2f 2
· · · ∂x∂1 ∂x
f

∂x21 n
 . .. 
 ..
H(f ) =  . .

∂2f ∂2f
∂xn ∂x1 ··· ∂x2 n
5A matriz hessiana H define uma forma bilinear (x, y) 7→ x · Hy que desempenha o papel de segunda derivada
de uma função de Rn em R. Não desenvolveremos este assunto neste texto.
Exemplo 3.2.6 Seja f (x, y) = x2 + y 2 . A sua matriz hessiana é

2 0
H(f ) = .
0 2
Exercı́cio 3.2.6 Calcule a matriz hessiana de f (x, y, z) = xyz.
Exercı́cio 3.2.7 1. Defina uma função cuja matriz hessiana seja, em qualquer ponto

a b
.
b c
2. Será que a função que encontrou na alı́nea anterior é única? Se não for tente encontrar uma
fórmula geral para esta famı́lia de funções.
3. Em que condições é que a matriz
a b
d c
é a hessiana de alguma função de classe C 2 ?
O resultado básico para classificar pontos de estacionaridade usando o termo de segunda ordem
da fórmula de Taylor é
Teorema 3.2.4
Sejam U ⊂ Rn um aberto, f : U → R uma função de classe C 2 (U ) e x0 ∈ U um ponto de
estacionaridade de f .
(2)
i) Se Dh f (x0 ) > 0 para todo o h 6= 0 então x0 é um ponto de mı́nimo local;
(2) (2)
ii) Se Dh f (x0 ) ≥ 0 para todo o vector h e existe um vector k 6= 0 tal que Dk f (x0 ) = 0 então
x0 não é um ponto de máximo local;
(2)
iii) Se Dh f (x0 ) < 0 para todo o h 6= 0 então x0 é um ponto de máximo local;
(2) (2)
iv) Se Dh f (x0 ) ≤ 0 para todo o vector h e existe um vector k 6= 0 tal que Dk f (x0 ) = 0 então
x0 não é um ponto de mı́nimo local;
(2) (2)
v) Se existem h, k ∈ Rn tais que Dh f (x0 ) < 0 e Dk f (x0 ) > 0 então x0 é um ponto de sela.
Ideia da demonstração. Para provar (ii), (iv) e (v) basta considerar as restrições de f às rectas
passando por x0 e nas direcções de h ou k e usar os resultados conhecidos6 para dimensão 1. Para
provar (i) ou (iii) devemos estudar o sinal de f (x) − f (x0 ) provando que se mantém constante
numa bola de raio suficientemente pequeno centrada em x0 . Isto é equivalente a estudar o sinal
de
f (x0 + h) − f (x0 ) 1 (2) Ef (x0 , h)
2 = Dh/|h| f (x0 ) + 2
|h| 2 |h|
em que a última parcela do segundo membro tende para 0 quando h → 0 de acordo com o teorema
de Taylor. Para completar a demonstração, por exemplo no caso (i), basta mostrar que para
(2)
h 6= 0 temos Dh/|h| f (x0 ) minorado por um número m > 0 e que existe uma bola centrada em x0
E (x ,h)
tal que aı́ f |h|02 > −m. O último destes dois factos segue da definição de limite e o primeiro
pode ser justificado usando resultados de álgebra linear sobre formas quadráticas ou o teorema de
(2)
Weierstrass aplicado à função7 S n−1 3 η 7→ Dη f (x0 ).
6 Obviamente pode refazer-se a demonstração mas queremos acentuar que não existe nenhuma ideia essencial-
mente nova em jogo.
7 S n−1 ≡ {x ∈ Rn : |x| = 1}.
O teorema anterior pode ser enunciado usando a terminologia de álgebra linear referente a
(2)
formas quadráticas. Com efeito
h Dh f (x
i 0 ) é a forma quadrática definida pela matriz hessiana de
∂2f (2)
f no ponto x0 , Hf (x0 ) ≡ ∂xi ∂xj (x0 ) , isto é, Dh f (x0 ) = h · Hf (x0 )h. As situações
i,j=1,...,n
(i-v) no enunciado do teorema correspondem respectivamente a esta forma quadrática8 ser defi-
nida positiva, semidefinida positiva não nula, definida negativa, semidefinida negativa não nula e
indefinida.
Corolário 3.2.5
Seja f : U ⊂ Rn → R uma função de classe C 2 numa vizinhança um ponto de estacionaridade em
x0 . Então:
1. Se H(f )(x0 ) = 0 o teste é inconclusivo.
2. Se H(f )(x0 ) for definida positiva (resp. negativa) então x0 é um ponto de mı́nimo (resp.
máximo) local.
3. Se H(f )(x0 ) for semi-definida positiva (resp. negativa) mas não nula então x0 não é um
ponto de máximo (resp. mı́nimo) local, isto é, pode ser ponto de mı́nimo (resp. máximo)
local ou ponto de sela.
4. Se H(f )(x0 ) for indefinida então x0 é um ponto de sela.
O teorema e o corolário não podem ser melhorados, através de informação só relativa a derivadas
de segunda ordem e de maneira a fornecer informação adicional para os casos em que a forma
quadrática é semidefinida, devido aos exemplos triviais que se seguem (3.2.8, 3.2.9).
Exemplo 3.2.7 Seja f (x, y) = x2 +y 2 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).

A matriz hessiana de f no ponto (0, 0) é

2 0
H(f ) = ,
0 2
que é definida positiva (os valores próprios são positivos). Portanto (0, 0) é um ponto de mı́nimo
local.
Exemplo 3.2.8 Seja f (x, y) = x2 +y 4 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).


2 0
H(f ) = ,
0 0
que é semi-definida positiva (os valores próprios são não negativos). Portanto (0, 0) não é um
ponto de máximo local. É fácil verificar que (0, 0) é um ponto de mı́nimo local e não um ponto de
sela. Com efeito, basta observar que, se (x, y) 6= (0, 0), se tem f (x, y) > f (0, 0) = 0.
Exemplo 3.2.9 Seja f (x, y) = x2 −y 4 . O ponto (0, 0) é um ponto de estacionaridade (verifique!).


2 0
H(f ) = ,
0 0
que é semi-definida positiva (os valores próprios são não negativos). Portanto (0, 0) não é um
ponto de máximo local. No entanto (0, 0) não é um ponto de mı́nimo local; com efeito, temos
f (0, 0) = 0 mas f (0, y) = −y 4 < 0 para y 6= 0 pelo que concluı́mos que (0, 0) é um ponto de sela.
8 Esta terminologia relativa a formas quadráticas usa-se também para as matrizes que as definem.
Exemplo 3.2.10 Seja f (x, y) = x2 − y 2 . O ponto (0, 0) é um ponto de estacionaridade (verifi-

que!). A matriz hessiana de f no ponto (0, 0) é

2 0
H(f ) = ,
0 −2
que é indefinida (um dos valores próprios é positivo e outro é negativo). Portanto (0, 0) é um
ponto de sela.
Exercı́cio 3.2.8 Prove que (0, 0) é um ponto de estacionaridade de f e classifique-o quanto a ser
ponto de máximo, ponto de mı́nimo ou ponto de sela quando f é definida em R2 por:
1. f (x, y) = 2x2 + y 2 ;
2. f (x, y) = xy;
3. f (x, y) = x2 + 2xy + y 2 ;
4. f (x, y) = y 4 − x4 ;
5. f (x, y) = x3 ;
6. f (x, y) = y 2 .
Problema 3.2.1 Elabore

um critério para classificar formas quadráticas definidas por uma matriz
2 × 2 da forma ab cb em função do sinal de d = ac − b2 e do sinal de a.
Os exemplos de aplicação do critério de segunda ordem até agora apresentados são no essencial
triviais e poderiam ser analisados por outros processos. Destinavam-se a definir situações tı́picas
e balizar as limitações do resultado. O exemplo seguinte já tem um carácter menos trivial.
Exemplo 3.2.11 Considere-se a função f : R2 → R definida por f (x, y) = xy + x2 y 3 − x3 y 2 .

Tentemos estudá-la quanto à existência de extremos.
Começamos por notar que graças a f ser um polinómio reconhecemos imediatamente que f
coincide com o seu desenvolvimento de Taylor de ordem igual ou superior ao seu grau. Tal é ver-
dadeiro em particular relativamente a (0, 0) que reconhecemos como um ponto de estacionaridade
(ausência de termos de primeira ordem) que é um ponto de sela (termo de segunda ordem xy).
Para determinar outros pontos de estacionaridade consideramos o sistema de estacionaridade

∂f
≡ y + 2xy 3 − 3x2 y 2 = 0


∂x

 ∂f ≡ x + 3x2 y 2 − 2x3 y = 0


∂y
que pode ser escrito de forma equivalente como

(
y(1 + 2xy 2 − 3x2 y) = 0
x(1 + 3xy 2 − 2x2 y) = 0.
Daı́ decorre que a única solução sobre os eixos coordenados é (0, 0) que já foi estudada. Podemos
então limitarmo-nos a analisar (
1 + 2xy 2 − 3x2 y = 0
1 + 3xy 2 − 2x2 y = 0.
Subtraindo termo a termo obtemos xy 2 + x2 y = 0 ou seja xy(y + x) = 0. Assim eventuais soluções
adicionais do sistema de estacionaridade encontrar-se-iam ou sobre os eixos coordenados (hipótese
já estudada) ou sobre a recta y = −x. Substituindo y por −x na primeira equação obtemos
1 + 5x3 = 0 o que fornece um segundo e último ponto de estacionaridade: (−5−1/3 , 5−1/3 ). Para
classificá-lo calculamos
∂2f
= 2y 3 − 6xy 2
∂x2
∂2f
= 6x2 y − 2x3
∂y 2
∂2f
= 1 + 6xy 2 − 6x2 y
∂x∂y
pelo que
−1/3 −1/3 8/5 7/5
Hf (−5 ,5 )=
7/5 8/5
uma matriz definida positiva pelo que este ponto de estacionaridade é um ponto de mı́nimo local
sendo o mı́nimo local f (−5−1/3 , 5−1/3 ) = − 35 5−2/3 .
Considerando, por exemplo, limλ→+∞ f (1, λ) = +∞, limλ→+∞ f (λ, 1) = −∞ verifica-se que
esta função não tem extremos absolutos.
O teorema 3.2.4 é passı́vel de várias generalizações. Aconselha-se no entanto o aluno a começar
por dominar o critério de segunda ordem e as ideias na sua demonstração pois são a base de
qualquer uma dessas generalizações. Mais geralmente um polinómio homogéneo de grau k designa-
se por forma de grau k. Uma generalização imediata do resultado anterior é
Problema 3.2.2 Seja f : D ⊂ Rn → R uma função de classe C k (D) e x0 um ponto interior a D

(j) (k)
tal que Dh f (x0 ) = 0 para j < k e h ∈ Rn e a forma de grau k Q definida por Q(h) = Dh f (x0 )
é definida positiva. Prove que x0 é um ponto de mı́nimo local de f . Formule e demonstre outras
generalizações do mesmo tipo do teorema 3.2.4.
Generalizações deste tipo poderão ser encontradas por exemplo em [2] (ver também o exercı́cio
3.2.12 e o problema 3.2.4). Factos triviais mas muito úteis são
Problema 3.2.3
a) Seja Q uma forma não nula de grau ı́mpar. Prove que Q é uma forma indefinida.
b) Seja P um polinómio de grau ı́mpar. Prove que P não é limitado superior ou inferiormente.
Exemplo 3.2.12 Considere-se a função g : R2 → R definida por

2
−y 2
g(x, y) = ex + y2 .
e tentemos classificar o ponto de estacionaridade (0, 0).

De maneira análoga ao exemplo 2.4.4 obtemos a partir da série de Taylor da exponencial
∞
X (x2 − y 2 )j
g(x, y) = 1 + x2 +
j=2
j!
para todo o (x, y) ∈ R2 . Note-se que a análise através do termo de segunda ordem da fórmula de
Taylor só nos permite afirmar que (0, 0) não é um ponto de máximo devido à forma quadrática se
anular na direcção do eixo dos y’s. Podemos tentar compreender o que se passa usando os termos
de ordem superior da fórmula de Taylor naquela direcção. O primeiro desses termos que não se
anula é de ordem 4, mais precisamente,
2
(x2 − y 2 )
g(x, y) = 1 + x2 + + E(x, y)
2
em que (xE(x,y)
2 +y 2 )2 → 0 quando (x, y) → 0. É de suspeitar que (0, 0) é um ponto de mı́nimo e
tentaremos prová-lo usando o mesmo raciocı́nio da demonstração do teorema 3.2.4 em que a
minimização do termo de segunda ordem por um número positivo é substituı́da pela minimização
simultânea dos termos de segunda e quarta ordem. A ideia natural é usar o termo de quarta
ordem para direcções “próximas” da do eixo dos y’s e o termo de segunda ordem para as restantes.
Como o termo de quarta ordem se anula para |x| = |y| e o de segunda ordem para x = 0 tentamos
caracterizar tais direcções respectivamente por |x| < 12 |y| e |x| ≥ 12 |y|.
Seja então |x| < 21 |y|. Obtemos

1 1 (2) 1 (4)
2 D g(0, 0) + D g(0, 0)
(x2 + y 2 ) 2 (x,y) 4! (x,y)
2
!
1 2 (x2 − y 2 ) 1 (x4 − 2x2 y 2 + y 4 ) 8 x4 − 12 y 4 + y 4 4
= 2 x + > 2 > 4
> .
(x2 + y 2 ) 2 5 2
( y ) 2 25 y 25
4
1
Por outro lado para |x| ≥ 2 |y| obtém-se

1 1 (2) 1 (4)
2 D(x,y) g(0, 0) + D(x,y) g(0, 0)
(x2 + y 2 ) 2 4!
2
!
1 (x2 − y 2 )
2 x2 x2 + y 2 1
= 2 x + > 2 ≥ 2 = .
(x2 + y2 ) 2 (x2 + y2 ) 4(x2 + y 2 ) 4(x2 + y 2 )
Agora já é possı́vel aplicar um raciocı́nio idêntico ao do teorema 3.2.4 para concluir que (0, 0) é
efectivamente um ponto de mı́nimo.
O leitor poderá ter considerado a resolução do exercı́cio 3.2.12 algo ad hoc e suspeitado que
existe um resultado abstracto que poderia ter sido usado. De facto assim é embora a maior parte
das ideias relevantes já conste da resolução do exercı́cio.
Problema 3.2.4 Sejam f : D ⊂ Rn → R, f ∈ C k (D), x0 um ponto interior a D. Suponha-se

(j)
que existe l < k tal que Dh f (x0 ) = 0 para todo o j < l e todo o h ∈ Rn , e que h 7→ Ql (h) ≡
(l)
Dh f (x0 ) é semidefinida positiva. Designamos os vectores unitários que anulam Ql como direcções
(j)
singulares. Suponha-se ainda que Dη f (x0 ) = 0 para toda a direcção singular η e l < j < k e que
(k)
Qk (η) ≡ Dη f (x0 ) > 0 para toda a direcção singular η. Mostre que:
a) O conjunto formado por todas as direcções singulares é um subconjunto fechado de S n−1 que
desigamos por F .
b) Qk tem um mı́nimo m1 > 0 sobre F e um mı́nimo m2 sobre S n−1 .
m1
c) Existe um aberto A ⊃ F tal que Qk (η) > 2 para todo o η ∈ S n−1 ∩ A.
d) Ql tem um mı́nimo m3 > 0 sobre S n−1 \ A.
e) Valem as estimativas
m3 E (x0 ,x−x0 )
+ mk!2 + f|x−x x−x0
(
f (x) − f (x0 ) l!|x−x0 |k−l k se |x−x0 | 6∈ A,
0|
k
≥ m1 Ef (x0 ,x−x0 ) x−x0
|x − x0 | 2k! + |x−x0 |k
se |x−x0 | ∈ A,
Ef (x0 ,x−x0 )
em que |x−x0 |k
→ 0 quando x → x0 .
f ) x0 é um ponto de mı́nimo local de f .

Para terminar convém referir mais uma vez que os testes baseados na fórmula de Taylor podem
ser inconclusivos devido às razões apontadas na introdução a este capı́tulo e aı́ exemplificadas com
funções reais de variável real.

Exercı́cio 3.2.9 Considere a função f : R3 → R definida por
p 2 p 3
f (x, y, z) = 2 − z − x2 + y 2 + z − x2 + y 2 .
a) Determine os respectivos pontos de extremo local e absoluto e, se tais pontos existirem,

classifique-os quanto a serem pontos de máximo ou de mı́nimo.
b) Determine um polinómio de grau menor ou igual a dois, P (x, y, z), tal que
f (x, y, z) − P (x, y, z)
lim 2 2 = 0,
(x,y,z)→(1,1,0) (x − 1) + (y − 1) + z 2
ou justifique que tal polinómio não existe.
Exercı́cio 3.2.10 Considere a função g : R3 → R definida por

p
g(x, y, z) = x3 (y 2 + z 2 ) 1 − x − y 2 + z 2 .
Estude g quanto à existência de extremos relativos e absolutos. Determine tais extremos se exis-
tirem e os pontos onde ocorrem. Sugestão: Considere primeiro h(x, ρ) = x3 ρ2 (1 − x − ρ).
Exercı́cio 3.2.11 Seja f : R2 → R definida por

xy 5
(
x2 +y 4 , se (x, y) 6= (0, 0)
f (x, y) =
0, se (x, y) = (0, 0).
a) Determine justificadamente o maior subconjunto do domı́nio de f em que existem e são

∂2f ∂2f
iguais as derivadas parciais ∂x∂y e ∂y∂x .
b) Determine e classifique os pontos de estacionaridade de f quanto a serem pontos de extremo

ou pontos de sela.
c) Determine o máximo e o mı́nimo da restrição de f ao conjunto A = {(x, y) ∈ R2 : x ≥

y 2 , y ≤ −x2 } e os pontos em que ocorrem esses extremos.
Exercı́cio 3.2.12 Considere a função f : R2 → R definida por
f (x, y) = (y + x2 )(x − y 2 ) + 1.
Determine, se existirem, os pontos de estacionaridade de f e classifique-os quanto a serem pontos

de extremo relativo ou pontos de extremo absoluto.

3.2.9
p
a) A função é constante sobre cada uma das superfı́cies de equação z − x2 + y 2 = α, α ∈ R
2 3
p a função R 3 α 7→ 2 − α + α . Conclui-se
pelo que basta estudar p facilmente que f tem um
máximo para z − x + y = 0 e um mı́nimo para z − x2 + y 2 = 2/3. Tais extremos não
2 2
são absolutos.
b) Tal polinómio existe e é obviamente o polinómio de Taylor de segunda ordem de f relativo

ao ponto (1, 1, 0).
Figura 3.5: Esta figura acompanha

p a sugestão de solução do exercı́cio 3.2.9. A função f é constante sobre
cada uma das folhas de cone z − x2 + y 2 = α.
J
3.2.10 Já vimos no exercı́cio 3.2.9 as vantagens em, quando possı́vel, usar simetrias da função
a estudar para estudar um problema equivalente em dimensão inferior. Naquele caso acabámos
estudando um problema unidimensional. No caso presente podemos estudar, usando a sugestão,
um problema bidimensional do qual recuperaremos o problema original por rotação em torno do
eixo dos x’s.
Vamos então estudar quanto à existência de extremos a função g : {(x, ρ) ∈ R2 : ρ ≥ 0} → R
definida por g(x, ρ) = x3 ρ2 (1 − x − ρ). Algo que convém fazer antes de iniciar qualquer tipo
de cálculo é tentar identificar linhas de nı́vel da função. A intersecção num ponto interior de
tais linhas de nı́vel formando um ângulo não nulo fornece-nos imediatamente a localização de um
ponto de estacionaridade9 . Tal é particularmente fácil para g pois esta função anula-se sobre o
eixo dos x’s, sobre o eixo dos ρ’s e sobre a recta 1 − x − ρ = 0. Isto identifica como ponto de
estacionaridade (x, ρ) = (1, 0) e se considerássemos a função estendida para ρ < 0 usando a mesma
fórmula o mesmo se poderia dizer dos pontos (0, 1) e (0, 0). É fácil de verificar por análise do sinal
de g que todos estes pontos são pontos de sela. Uma observação adicional que se obtém dessa
análise é o facto de g ser positiva no interior do triângulo T limitado pelas rectas atrás referidas,
isto é,
T = {(x, ρ) ∈ R2 : x ≥ 0, ρ ≥ 0, x + ρ ≤ 1}.
Como T é limitado e fechado há-de existir no interior de T pelo menos mais um ponto de máximo
de g que será portanto mais um ponto de estacionaridade de g. Eventualmente existirão outros
pontos de estacionaridade. Todos estes factos servirão para verificar a resolução do sistema de
estacionaridade de g (
∂g 2 2
∂x ≡ x ρ (3(1 − x − ρ) − x) = 0
∂g 3
∂ρ ≡ x ρ(2(1 − x − ρ) − ρ) = 0.
Verificamos imediatamente que todos os pontos sobre os eixos são pontos de estacionaridade.
Todos os pontos sobre o eixo dos ρ’s são pontos de sela por análise do sinal de g. Sobre o eixo dos
9 Enunciado e justificação rigorosa desta afirmação são algo que não pretendemos apresentar neste momento.
Veja mais à frente o problema ??.
x
1 1
–
x+
ρ
+
=
1
ρ
1

z 1
+
–
1

Figura 3.6: Esta figura acompanha o exercı́cio 3.2.10. A função f exibe simetria radial relativamente ao
eixo dos x’s. No gráfico da direita indicam-se os zeros e sinais de g.
x’s a situação é mais complexa: (x, 0) é um ponto de mı́nimo se 0 < x < 1, um ponto de máximo
se x < 0 ou 1 < x, e um ponto de sela se x = 0 ou x = 1. Pontos de estacionaridade que não se
encontrem sobre os eixos deverão satisfazer
(
3(1 − x − ρ) − x = 0
2(1 − x − ρ) − ρ = 0.
Este sistema linear tem uma única solução: (1/2, 1/3), a solução no interior de T cuja existência
já tinha sido garantida e que sabemos tratar-se de um ponto de máximo.
É fácil verificar que g e consequentemente f não têm extremos absolutos.
Podemos concluir que f possui pontos de máximo local nos pontos da circunferência definida
por x = 1/2, y 2 + z 2 = 1/9 onde f vale 1/432, outros pontos de máximo local nos pontos (x, 0, 0)
com x < 0 ou x > 1 onde f vale 0, e pontos de mı́nimo local nos pontos (x, 0, 0) com 0 < x < 1
onde f vale 0. J
3.2.11
y
1 x
-1 x = y2
y= - x2
Figura 3.7: Esta figura acompanha os esboços de resolução dos Exercı́cios 3.2.11 e 3.2.12.
a) No complementar da origem f é uma função de classe C ∞ pelo que aı́ verifica-se a igualdade
∂2f ∂2f
∂x∂y = ∂y∂x . Resta-nos investigar o que se passa na origem. Como a função se anula sobre
os eixos coordenados decorre da definição de derivada parcial que

∂f ∂f
(0, 0) = (0, 0) = 0.
∂x ∂y
Além disso se (x, y) = / = (0, 0) temos
∂f y 5 (x2 + y 4 ) − 2x2 y 5 y 9 − x2 y 5
(x, y) = 2 = 2
∂x (x2 + y 4 ) (x2 + y 4 )
∂f 5xy 4 (x2 + y 4 ) − 4xy 8 xy 8 + 5x3 y 4
(x, y) = 2 = 2
∂y (x2 + y 4 ) (x2 + y 4 )
donde decorre usando a definição de derivada parcial
∂2f ∂2f
(0, 0) = 1 (0, 0) = 0
∂y∂x ∂x∂y
pelo que o conjunto pretendido é R2 \ {(0, 0)}.

b) Do cálculo das derivadas parciais de primeira ordem sabemos que (0, 0) é um ponto de
estacionaridade e outros pontos de estacionaridade serão soluções de
(
y 9 − x2 y 5 =0
8 3 4
xy + 5x y = 0
donde todos os pontos sobre o eixo dos x’s são pontos de estacionaridade. Outros pontos de
estacionaridade deverão satisfazer
(
y 4 − x2 =0
4 3
xy + 5x = 0.
Da primeira equação deste sistema eventuais soluções adicionais devem satisfazer y 4 = x2 .

Por substituição na segunda equação obtém-se unicamente a solução (x, y) = (0, 0). Estabe-
lecemos então que o conjunto dos pontos de estacionaridade é o eixo dos x’s. Por análise do
sinal da função na sua vizinhança verificamos que todos são pontos de sela.
c) Os extremos absolutos de f restringida a A ocorrem nalgum ponto de A pois trata-se de um

conjunto limitado e fechado. Se ocorressem em pontos interiores tais pontos seriam pontos
de extremo local o que da alı́nea anterior não acontece. Assim estudamos a restrição de f à
fronteira de A (veja a figura 3.7). Definimos g(y) = f (y 2 , y) = y 3 /2 para −1 ≤ y ≤ 0. Temos
−1/2 = g(−1) < g(y) < g(0) = 0 sempre que −1 < y < 0. Definimos h(x) = f (x, −x2 ) =
x9 0 9x8 (1+x6 )−6x14 14
+9x8
− 1+x 6 para 0 ≤ x ≤ 1. Como h (x) = −
(1+x6 )2
= − 3x
(1+x6 )2
< 0 para 0 < x < 1
temos −1/2 = h(1) < h(x) < h(0) = 0 para 0 < x < 1. As funções g e h dão-nos os valores
de f sobre a fronteira de A. Podemos concluir que −1 = f (1, −1) < f (x, y) < f (0, 0) = 0
para todo os (x, y) ∈ A \ {(0, 0), (1, −1)}.
J
3.2.12 O conjunto de zeros de f está esboçado na figura 3.2.11. Observe que (0, 0) e (1, −1) são
necessariamente √ pontos de sela e que existirá pelo menos um ponto de extremo local na região
definida por − x ≤ y ≤ −x2 . A solução do sistema de estacionaridade permite obter com efeito
que os únicos pontos de estacionaridade são (0, 0), (1/2, −1/2) e (1, −1). Por análise do sinal de f
conclui-se que (1/2, −1/2) é um ponto de mı́nimo local. A função não tem extremos absolutos. J
Capı́tulo 4
Teoremas da Função Inversa e da

Função Implı́cita
Neste capı́tulo vamos estudar condições que permitem assegurar a existência da inversa de funções
de Rn → Rn , bem como condições que garantam a resolubilidade de equações da forma f (x, y) = 0
de modo a obtermos uma das variáveis em função da outra. Em casos simples conseguimos inverter
as funções ou resolver as equações explicitamente; no entanto, na maioria dos casos, tal tarefa é
complexa se não impossı́vel. Os resultados gerais que obteremos (teoremas 4.3.1 e 4.4.1) asseguram
a resolução destas questões num sentido local a precisar.
Exercı́cio 4.0.13 Convença-se da dificuldade de resolver problemas do tipo mencionado tentanto

inverter a função f : R+ × R+ → R2 definida por
f (x, y) = (xy, x2 − y 2 ).
Note que a análise deste problema pode ser feita de uma forma simples!
4.1 Invertibilidade de funções

Comecemos por recordar a definição de função injectiva
Definição 4.1.1 Diz-se que uma função f : A → B, onde A e B são conjuntos arbitrários, é
injectiva se, sempre que x 6= y (x, y ∈ A), se tenha f (x) 6= f (y).
Observe que a definição anterior é equivalente a dizer que se f (x) = f (y) então necessariamente
se verifica x = y. É também equivalente a mostrar que a equação f (x) = a, para a ∈ B, tem,
quando muito, uma solução.
Exercı́cio 4.1.1 Prove estas duas últimas afirmações.

Consideremos agora o seguinte exemplo:
Exemplo 4.1.1 Seja f : R2 → R+ × R+ a função definida por
f (x, y) = (ex , ex+y ).
Provemos que ela é injectiva. Suponhamos que f (x1 , y1 ) = f (x2 , y2 ). Então
ex1 = ex2 ex1 +y1 = ex2 +y2 .
A primeira equação implica x1 = x2 . Utilizando este resultado na segunda equação obtemos

y1 = y2 pelo que f é injectiva.
47
CAPÍTULO 4. TEOREMAS DA FUNÇÃO INVERSA E DA FUNÇÃO IMPLÍCITA
0.5
0.5 1 1.5 2
-0.5
-1
Figura 4.1: Rectas x = 1 e x + y = 1
Exercı́cio 4.1.2 Prove que a função identidade de Rn em Rn , isto é, f : Rn → Rn definida por
f (x) = x, é injectiva.
Poderı́amos ter resolvido o exemplo anterior utilizando o método gráfico que veremos de seguida:
Exemplo 4.1.2 Seja (a, b) com a, b > 0 um ponto no contradomı́nio de f . Queremos mostrar
que o sistema
ex = a e ex+y = b
só tem uma solução. Graficamente, as soluções vão ser a intersecção das rectas da forma x =
log a ≡ c e x + y = log b ≡ d. Como se pode ver na figura 4.1 (para c = d = 1) estas rectas
intersectam-se num único ponto uma vez que não são paralelas. Assim, como para cada par (a, b)
existe no máximo uma pré-imagem,1 concluı́mos que a função é injectiva.
Este exemplo sugere que é possı́vel, utilizando apenas argumentos de natureza geométrica,
verificar a injectividade de uma função. Sistematizemos este processo. Seja f uma função contı́nua,
f : R2 → R2 , com f = (f1 , f2 ). Suponhamos que queremos estudar a injectividade de f bem como
caracterizar o seu contradomı́nio.
Consideremos Ca1 , conjunto de nı́vel de f1 , definido por f1 (x, y) = a e Cb2 , definido por
f2 (x, y) = b, conjunto de nı́vel de f2 , sendo a e b reais fixos. Podemos (em princı́pio), para
cada par (a, b), desenhar estes dois conjuntos; estudando o número de pontos de intersecção destas
curvas para valores de a e b arbitrários podemos tirar conclusões importantes sobre a injectividade
e contradomı́nio de f , tal como afirma a próxima proposição (observe a figura ).
Seja f : A ⊂ R2 → R2 (f = (f1 , f2 )) uma função contı́nua. Defina-se
Ca1 = {(x, y) ∈ A : f1 (x, y) = a} e Cb2 = {(x, y) ∈ A : f2 (x, y) = b} .

Então:
1. o contradomı́nio de f é o conjunto de pontos (a, b) ∈ R2 tais que Ca1 ∩ Cb2 6= ∅;
2. a função é injectiva sse para qualquer par (a, b) ∈ R2 , o conjunto Ca1 ∩ Cb2 tiver no máximo
um elemento.
Exercı́cio 4.1.3 Demonstre a proposição anterior.
Exercı́cio 4.1.4 Decida se a função f (x, y) = (x + y, x2 + y 2 ) é ou não injectiva.

Este método, sendo bastante geral para o caso de funções de R2 → R2 , não é fácil de aplicar,
pelo menos directamente, no caso mais geral de funções com mais de 2 variáveis, visto que o
desenho de superfı́cies em R3 é bastante difı́cil e em Rn , n ≥ 4, praticamente impossı́vel. No
entanto, nalguns casos particulares ainda é possı́vel utilizar ideias semelhantes, como podemos
verificar no exemplo seguinte.
1A pré-imagem de (a, b) é o conjunto de todos os pontos x do domı́nio de f tais que f (x) = (a, b).
4.1. INVERTIBILIDADE DE FUNÇÕES
f |T-1
f |T
f |S-1
f |S
S
linhas de
nível de f2
linhas de
nível de f1
Figura 4.2: O método gráfico para analisar invertibilidade de aplicações de R2 em R2 e invertibilidade

local versus invertibilidade global. As curvas de nı́vel de f1 e f2 intersectam-se em dois pontos pelo que
(f1 , f2 ) não é injectiva. No entanto a restrição a S ou a T é injectiva.
Exemplo 4.1.3 Consideremos a função f : R3 → R3 definida por
f (x, y, z) = (x2 + y 2 + z 2 , x + y + z, x − y).
Mostremos que ela não é injectiva. Seja (a, b, c) um ponto no contradomı́nio de f . Podemos tomar,
por exemplo, b = c = 0 e a > 0. A equação
f (x, y, z) = (a, 0, 0)
tem como solução os pontos que estão na intersecção da esfera centrada na origem definida por
x2 + y 2 + z 2 = a
(note que esta equação define uma esfera pois a > 0) com a recta definida por
x+y+z =0 x−y =0 (4.1)
(a equação x + y + z = 0 define um plano que intersecta o plano x − y = 0 numa recta). Esta

recta, que passa pela origem ((x, y, z) = (0, 0, 0) satisfaz o sistema 4.1), intersecta qualquer esfera
centrada na origem em dois pontos distintos. Desta observação concluı́mos imediatamente que f
não pode ser injectiva.
A complexidade de exemplos como os anteriores não ocorre para transformações lineares. Nesse
caso a injectividade local garante invertibilidade global.
Exercı́cio 4.1.5 Seja T uma transformação linear de Rn em Rn . Justifique que o contradomı́nio

de T é Rn sse T é injectiva numa vizinhança de 0 sse T é invertı́vel.
A próxima proposição relaciona a injectividade com a possibilidade de invertermos uma função.
Seja f uma função de A ⊂ Rn em B ⊂ Rn . Se f for injectiva, existe uma função g : f (A) ⊂ B → A
tal que (g ◦ f )(x) = x para todo o x ∈ A. A esta função g chama-se inversa de f e designa-se por
f −1 .
Nota: A função inversa terá como domı́nio a imagem por f de A, ou seja o conjunto f (A) = {y ∈
B : y = f (x), x ∈ A} e não o conjunto B a não ser que f seja sobrejectiva (isto é f (A) = B).
Exemplo 4.1.4 Vamos calcular a inversa da função f : [π, 2π] → R definida porf (x) = cos x.
Sabemos que neste intervalo a função cos é injectiva (desenhe o gráfico do coseno!). Também
sabemos que o contradomı́nio de f é o intervalo [−1, 1] pelo que a inversa será uma função f −1 :
A ⊂ [−1, 1] → [π, 2π]. A função arccos x é a inversa do coseno mas no intervalo [0, π]. É fácil
verificar que a inversa de f é dada por f −1 (y) = 2π − arccos y.
Exercı́cio 4.1.6 Calcule a inversa da função fn (x) = sen x, onde fn : [(n − 1/2)π, (n + 1/2)π] →
R.
4.1.1 Exercı́cios Suplementares

Exercı́cio 4.1.7 Diga se as seguintes funções são ou não injectivas:

1. f : {(x, y) ∈ R2 : y 6= 0} → R+ × R+ definida por f (x, y) = ex/y , x2 + y 2 .
2. f : R2 → R2 definida por f (x, y) = (xy, x2 − y 2 ).
3. f : R2 → R2 definida por f (x, y) = (x2 + 2y 2 , 2x2 + y 2 ).
4. f : R2 → R definida por f (x, y) = x2 + y 2 .
Exercı́cio 4.1.8 Mostre que a composição de funções injectivas é uma função injectiva.
Exercı́cio 4.1.9 Dê uma condição para que uma transformação linear de Rn → Rn seja injectiva.
Exercı́cio 4.1.10
1. Seja f : R → R uma função estritamente monótona. Justifique que f é injectiva.
2. Dê um exemplo de uma função monótona não injectiva.
3. Dê um exemplo de uma função não monótona injectiva.
Exercı́cio 4.1.11 Prove que uma função real de variável real monótona mas não estritamente
monótona não é injectiva.
Exercı́cio 4.1.12 Seja f : R → R, contı́nua. Prove que f é estritamente monótona sse for
injectiva. Dê um exemplo de um conjunto A ⊂ R e de uma função f : A → R contı́nua tal que f
não seja monótona mas seja injectiva.
Exercı́cio 4.1.13 Mostre que a função f (v) = √ v com v ∈ ] − 1, 1[ é injectiva e determine o

1−v 2
seu contradomı́nio.
Exercı́cio 4.1.14 Mostre que uma função real de variável real par nunca é injectiva.
4.1. INVERTIBILIDADE DE FUNÇÕES
Exercı́cio 4.1.15 Mostre que uma função real de variável real diferenciável é injectiva se a sua
derivada for sempre positiva ou sempre negativa.
Exercı́cio 4.1.16 Consideremos a função f : R3 → R+ × R2 definida por
f (x, y, z) = ex+z , (x + y)3 , (x − y)5 .

Mostre que ela é injectiva.
Exercı́cio 4.1.17 Considere a função f : R3 → R3 definida por
f (x, y, z) = (4x2 + y 2 + 2z 2 , (x + y − z)2n+1 , (x − y)4n+3 )
para n ∈ N. Determine se ela é injectiva. Determine se a restrição de f a R+ × R+ × R+ é ou

não injectiva.
Exercı́cio 4.1.18 Mostre que se uma função f : Rn → Rn verificar para todos os pontos x, y
kf (x) − f (y)k ≥ ckx − ykp ,
para alguns p, c > 0 então f é injectiva.
Exercı́cio 4.1.19 Prove que a função f : {(x, y) ∈ R2 : x > 0, 0 ≤ y < 2π} → R definida por
f (x, y) = (x cos y, x sen y) é injectiva e determine a sua inversa.

4.1.7
x
1. Repare que para a, b > 0, as curvas de nı́vel definidas por = a são as rectas definidas por
y
2 2
√
x = ay e as curvas definidas por x + y = b são circunferências de raio b.
2. Repare que para a, b 6= 0, as curvas de nı́vel definidas por xy = a são hipérboles bem como
as definidas por x2 − y 2 = (x + y)(x − y) = b são também hipérboles.
3. Ambas as curvas de nı́vel são elipses.
4. f (1, 0) = f (0, 1). Tente descobrir geometricamente porque é que f não é injectiva.
J
4.1.8 f (g(x)) = f (g(y)) ⇒ g(x) = g(y) ⇒ x = y. J
n
4.1.9 A equação Ax = y tem solução única em R sse det A 6= 0. J
4.1.10
1. f é estritamente monótona sse x < y então f (x) < f (y) ou f (x) > f (y).
2. Por exemplo f (x) = 1 para x ∈ R.
3. Por exemplo f (x) = 1/x para x ∈ R \ {0}, f (0) = 0.
J
4.1.11 Escreva a definição de função estritamente monótona e compare com a definição de função
monótona. J
4.1.12 Recorde o que fez no exercı́cio anterior e utilize as propriedades das funções contı́nuas. J
4.1.13 A função é estritamente crescente e portanto injectiva. O seu contradomı́nio é R. J
4.1.14 Se f é par então f (x) = f (−x). J
4.1.15 Se a derivada for sempre positiva ou sempre negativa a função é monótona. J

4.1.16 Repare que a função é a composição da transformação linear (x, y, z) → (x + z, x + y, x − y)
com a função (x, y, z) → (ex , y 3 , z 5 ). Se ambas as funções forem injectivas f também será.
Alternativamente poderá aplicar o método gráfico. J
4.1.17 As soluções da equação f (x, y, z) = (a, b, c) estão sobre a intersecção de um elipsóide com
dois planos. J
p
4.1.18 Se f (x) = f (y) temos 0 ≥ kf (x) − f (y)k ≥ ckx − yk o que implica x = y. J
4.1.19 Repare que a inversa pode ter de ser escrita “por ramos” (veja o exemplo 4.1.4). J
4.2 Teorema do valor médio para funções vectoriais

Vai ser necessário, em particular ao iniciar o estudo do teorema da função inversa, estimar dis-
tâncias no contradomı́nio de uma função em termos de distâncias no domı́nio, isto é, estimar
kF (x) − F (y)k em termos de kx − yk. Para tal necessitaremos do
Lema 4.2.1 (Teorema do valor médio)

Seja F : U ⊂ Rn → Rm uma função de classe C 1 (S). Sejam x, y ∈ S e tais que o segmento de
recta que une x a y está contido em S. Então
kF (x) − F (y)k ≤ sup kDF (tx + (1 − t)y)(x − y)k.

t∈[0,1]
Ideia da demonstração. Mais uma vez recorremos ao teorema do valor médio para funções escalares
através de uma função auxiliar. Seja g(t) = (F (x) − F (y)) · F (tx + (1 − t)y). Aplique-se o teorema
do valor médio a g no intervalo [0, 1] e estime-se usando a desigualdade de Cauchy-Schwarz.
Este resultado ainda não tem a forma pretendida. Para isso introduzimos
Definição 4.2.1 (Norma de aplicações lineares e de matrizes) Seja L : Rn → Rm uma

aplicação linear. Definimos a norma de L como sendo
kLk ≡ sup kL(x)k.

kxk=1
Seja A ∈ Mm×n . Definimos a norma de A através de
kAk = kLA k.
em que LA é a aplicação linear definida canonicamente pela matriz √ A via LA (x) = Ax. Por vezes
consideraremos outras normas para matrizes reais como kAk2 = tr AT A ou kAk∞ = máxi,j |aij |
em que A = (aij )i,j=1,...,n . Continua a valer nesta situação a observação feita para normas em Rn
de que todas estas normas são equivalentes. O problema seguinte formaliza isso de alguma forma.
Problema 4.2.1 Seja E um espaço vectorial real ou complexo. Designe-se K = R ou K = C

conforme o caso. Uma função η : E → R diz-se uma norma em E se verifica as propriedades
enumeradas na definição 2.1.1 substituindo Rn ↔ E e x ∈ R ↔ x ∈ K.
1. Verifique que as normas de aplicações lineares e matrizes da definição 4.2.1 são normas
nesta acepção geral.
2. Verifique que quaisquer duas normas num espaço vectorial de dimensão finita são equivalen-
tes (adapte o enunciado e solução do exercı́cio 2.1.13).
3. Quais são as melhores contantes na equivalência entre as normas de matrizes mencionadas
na definição 4.2.1?
4.3. TEOREMA DA FUNÇÃO INVERSA
Corolário 4.2.2
Sob as mesmas hipóteses do lema 4.2.1 vale
kF (x) − F (y)k ≤ máx kDF (tx + (1 − t)y)kkx − yk. (4.2)

t∈[0,1]
Mais geralmente se F ∈ C 1 (K), com K um conjunto limitado, fechado e convexo2 , então para
todos os x, y ∈ K temos
|F (x) − F (y)| ≤ máx kDF (tx + (1 − t)y)kkx − yk.

t∈[0,1]
Ambos os máximos atrás referidos são finitos (porquê?).
Problema 4.2.2 Convém notar que não existe uma versão do teorema do valor médio para fun-
ções vectoriais análoga à conhecida para funções escalares e que envolva uma igualdade da forma
f (b) − f (a) = Df (a + θ(b − a))(b − a). Com efeito, pode verificar que para a função g : R → R2
definida por g(t) = (cos t, sen t) não existe θ ∈ ]0, 2π[ tal que g(2π) − g(0) = Dg(θ)(2π) embora a
desigualdade 4.2.
Problema 4.2.3 Seja A ∈ Mn×n e LA a aplicação linear definida canonicamente por A como
definido anteriormente. Obtenha uma expressão para o valor de kLA k em termos dos valores
próprios de AT A.
4.3 Teorema da Função Inversa

Em primeira aproximação o teorema da função inversa diz respeito à resolução de sistemas de
equações não lineares da forma
F (x) = y (4.3)
em que x, y ∈ Rn . Pretende-se obter, sob condições apropriadas, a garantia de existência de uma
função que nos dê x em função de y satisfazendo a equação, avaliar da regularidade de tal função
e relacionar a derivada da inversa com a derivada de F . Tais objectivos só são exequı́veis sob
condições particulares e desde que entendamos a existência de inversa num sentido local, isto é,
dado um ponto x0 no domı́nio de F estabelece-se a existência de vizinhanças V de x0 e W de
F (x0 ) e de uma função G : W → V tal que para todo o x ∈ V temos G(F (x)) = x. Nota-se que
são casos particulares já conhecidos os seguintes:
Exemplo 4.3.1 (Caso linear) Suponha-se que A ∈ M, em que M designa as matrizes reais
n × n, e b ∈ Rn . Considere-se
F (x) ≡ Ax + b.
Então o sistema (4.3) é solúvel se e só se det A 6= 0 e nesse caso podemos obter explicitamente
x = A−1 (y − b) ≡ F −1 (y).
Note-se que neste caso DF = A, F −1 é diferenciável e (DF )−1 = A−1 .
Exemplo 4.3.2 (Dimensão 1) Seja f : ]a, b[ → R, f ∈ C 1 (]a, b[) , a < x0 < b, y0 ≡ f (x0 ),
f 0 (x0 ) 6= 0. Então f 0 mantém o seu sinal numa vizinhança V de x0 e consequentemente f é
estritamente monótona em V . Assim a restrição de f a V , f |V , é invertı́vel, diferenciável e se
−1 −1
g ≡ (f |V ) temos g 0 (y0 ) = [f 0 (x0 )] .
Nesta situação podemos abdicar de alguma regularidade de f , supondo f unicamente diferen-
ciável em vez de C 1 desde que suponhamos que f 0 mantém o seu sinal num intervalo J contendo
x0 . Podemos então concluir que f é invertı́vel em J.
2 Um subconjunto de um espaço vectorial diz-se convexo se contém qualquer segmento de recta definido por um
par dos seus pontos.
A segunda parte do exemplo anterior deve ser contrastado com
Problema 4.3.1 Considere a aplicação3 R2 3 (x, y) 7→ (ex cos y, ex sen y). Verifique que o deter-
minante da matriz jacobiana desta função mantém o sinal em R2 e no entanto a função não é
invertı́vel. No entanto, dado um ponto existe uma vizinhança tal que a restrição da função a essa
vizinhança é invertı́vel.
Basta ter em conta o caso linear descrito no exemplo 4.3.1 para constatar que a generalização
do teorema da função inversa que procuramos não terá entre as suas hipóteses DF (x0 ) 6= 0 por
esta hipótese não ser suficiente para garantir invertibilidade. O caso linear sugere fortemente que
uma hipótese a considerar seja DF (x0 ) invertı́vel e, de facto, assim é. Uma forte sugestão de que
assim será decorre também do seguinte problema
Problema 4.3.2 Considere uma função F definida num aberto, diferenciável e que possui inversa
diferenciável.
a) Verifique a relação (DF )−1 = D(F −1 ).
b) Verifique que se F ∈ C 1 então F −1 ∈ C 1 .
A importância do teorema da função inversa vai decorrer não só do resultado em si mas também
dos métodos a aplicar na demonstração serem susceptı́veis de generalização a outras áreas de
Matemática4 . Por isso vamos dedicar algum tempo a motivar e descrever as principais ideias da
sua demonstração. No entanto, antes de iniciar a discussão do teorema propriamente dito convém
notar algus factos elementares.
A ideia base consiste na construção da inversa local através dum limite de aproximações su-
cessivas sendo cada aproximação construı́da através da resolução dum problema linear em que um
dos dados é o termo anterior da sucessão. Designaremos tal sucessão por (xi )i∈N e a aplicação
que associa a cada termo da sucessão o termo seguinte por Ty , isto é Ty (xi−1 ) = xi para i ∈ N.
O domı́nio de Ty será uma vizinhança V de x0 e y ∈ W uma vizinhança de y0 ≡ F (x0 ). Tais
vizinhanças serão escolhidas suficientemente pequenas de maneira a aı́ se verificarem condições que
garantam a convergência da sucessão (xi )i∈N . Existem pelo menos duas hipóteses naturais para
a escolha de Ty via a substituição de F por uma sua aproximação linear e resolução do sistema
linear correspondente:
−1
Ty (x) = x + DF (x) (y − F (x)) (4.4)
ou
−1
Ty (x) = x + DF (x0 ) (y − F (x)). (4.5)
O significado de cada uma destas duas escolhas é ilustrado para o caso unidimensional na figura 4.3.
Embora a primeira possa parecer mais natural a segunda tem a vantagem de não ser necessário ter
de controlar a variação da derivada DF (x) o que permitirá alguma simplificação do argumento 5 .
Consideramos então que Ty está definida por (4.5) com x e y em vizinhanças a especificar de x0
e y0 .
Convencionamos que Ty0 ≡ Ty e Tyk ≡ Ty ◦ Tyk−1 . Pretendemos provar que a inversa local, G,
é dada por
G(y) = lim Tyk (x0 ). (4.6)
k→∞
Exercı́cio 4.3.1 Experimente aplicar o algoritmo descrito ao problema de determinar zeros de

f (x) = x − x2 começando com x0 = 1/2. E com x0 = 4?
3 Verificaremos mais tarde que se identificarmos R2 a C da maneira habitual esta aplicação é simplesmente
C 3 z 7→ ez .
4 Para a maioria dos alunos tais exemplos serão encontrados ao estudar Análise Numérica e Equações Diferenciais
Ordinárias.
5 A opção pela segunda hipótese é também natural do ponto de vista do método numérico, conhecido por método
de Newton, a que corresponde, pois evita recalcular e inverter uma matriz em cada iteração
y0
y0
y
x2 x1 x0 x2 x1 x0
Figura 4.3: Duas hipóteses para a determinação de raı́zes de uma equação não linear por iterações
sucessivas.
Claro que uma hipótese necessária para que estas ideias funcionem será exigir que DF (x0 ) seja
invertı́vel ou de forma equivalente que o determinante da matriz jacobiana em x0 seja não nulo.
Primeiro verificaremos que o limite em 4.6 existe e só depois que o limite é a solução pretendida.
Finalmente verificar-se-á a regularidade da inversa local construı́da.
Resumindo, os passos essenciais da demonstração do teorema da função inversa são:
1. Mostrar que a sucessão de aproximações sucessivas (xk )k∈N é convergente.
2. Mostrar que o limite da sucessão define uma inversa local.
3. Mostrar que a inversa local é de classe C 1 .
Comecemos então por tentar provar que a sucesssão de aproximações sucessivas é convergente.
Tal será feito à custa de um desenvolvimento “telescópico” dos termos da sucessão da seguinte
forma
Xi
xi = x0 + (xj − xj−1 ).
j=1
Tal
P permite reduzir o estudo da convergência da sucessão ao estudo da convergência da série
xj − xj−1 . Para isso iremos utilizar
P+∞ P+∞
Problema 4.3.3 Seja k=1 xk uma série de termo geral em Rn . Prove que se a série k=1 kxk k
é convergente em R então a série é convergente6 .
P
Para provar a convergência da série j kxj −xj−1 k tentaremos estabelecer condições que garantem
que o seu termo geral é majorado pelo de uma série geométrica convergente. Isto equivale a exigir
que
kxj+1 − xj k ≤ ρkxj − xj−1 k
para alguma constante ρ, com 0 ≤ ρ < 1. Ora
xj+1 − xj = Ty (xj ) − Ty (xj−1 )
pelo que tal objectivo estará garantido se a aplicação Ty verificar para todo o x, z ∈ V e todo o
y∈W
kTy (x) − Ty (z)k ≤ ρkx − zk. (4.7)
6 Nestas condições diz-se que a série é absolutamente convergente.
U
f W
V
y0

x0
–1
(f|V )
Figura 4.4: Algumas das convenções na demonstração do teorema da função inversa.
Com efeito
kTy (x) − Ty (z)k = kx − z − DF (x0 )−1 (F (x) − F (z))k

= kDF (x0 )−1 (F (x) − F (z) − DF (x0 )(x − z))k
≤ M k(F (x) − F (z) − DF (x0 )(x − z))k
≤ M αkx − zk,
em que M = kDF (x0 )−1 k e na última passagem usou-se o teorema do valor médio aplicado à
função H(x) = F (x) − DF (x0 )(x − x0 ) sendo α = supx∈V kDH(x)k e exigindo que V seja
convexa (uma bola). Notando que DH(x0 ) = 0 e usando a continuidade das derivadas parciais de
F , concluı́mos que podemos fazer M α < 1 desde que V seja suficientemente pequena (uma bola
com raio suficientemente pequeno B (x0 )).
Provamos agora que os termos das sucessões e os seus limites pertencem à vizinhança V de
x0 desde que W e V sejam escolhidas suficientemente pequenas. Isto completará a justificação da
convergência da sucessão de aproximações sucessivas. Para isso estimamos
kTy (x) − x0 k = kx − x0 + DF (x0 )−1 (y − F (x0 ) + F (x0 ) − F (x))k

≤ kDF (x0 )−1 (y − F (x0 ))k + kx − x0 + DF (x0 )−1 (F (x0 ) − F (x))k
≤ M ky − F (x0 )k + M k(F (x0 ) − F (x)) − DF (x0 )(x0 − x)k
≤ M ky − F (x0 )k + M αkx0 − xk
de oonde podemos concluir que, se escolhermos > 0 de maneira a que kx0 −xk < garanta M α <
1/3, podemos escolher também ky−F (x0 )k < r de maneira a M r < /3, donde kTy (x)−x0 k < 23 .
Logo todos os termos das sucessões e os seus limites estarão em B 23 (x0 ) ⊂ B (x0 ) ≡ V .
Notamos também que G(y) satisfaz F (G(y)) = y se Ty (G(y)) = G(y). Esta última igualdade
decorre da continuidade de Ty que por sua vez decorre da desigualdade (4.7). Assim G satisfaz
F (G(y)) = y.
Ainda não provámos que numa vizinhança suficientemente pequena de x0 a função F é injectiva.
A não injectividade corresponderia à existência de x, z, x 6= z tais que F (x) = F (z) = y. Terı́amos
então também Ty (x) = Ty (z). Assim kx − zk = kTy (x) − Ty (z)k ≤ ρkx − zk com 0 < ρ < 1, para
x, z ∈ B (x0 ), o que é impossı́vel a não ser que x = z.
Resta agora estabelecer propriedades da inversa local. Note-se que, se estabelecermos que
a inversa local é diferenciável com derivada dada por DG(F (x)) = (DF (x))−1 , a continuidade
de DF mais a fórmula explı́tica para a matriz jacobiana de G estabelecem que DG ∈ C 17 . A
7 De forma análoga se F ∈ C k então G ∈ C k com k ≥ 2 ou k = ∞
unicidade local da inversa permite limitarmo-nos a analisar a diferenciabilidade em y0 = F (x0 ).

Para tal, convencionando F (x) = y e x 6= x0 , considera-se
E ≡ kG(y) − G(y0 ) − DF (x0 )−1 (y − y0 )k
= kx − x0 − DF (x0 )−1 (F (x) − F (x0 ))k
= kx − x0 − DF (x0 )−1 (DF (x0 )(x − x0 ) + o(kx − x0 k))k
= k − DF (x0 )−1 (o(kx − x0 k))k
≤ kDF (x0 )−1 kko(kx − x0 k)k.
Demonstrar a diferenciabilidade de G em y0 com derivada DF (x0 )−1 corresponde a mostrar que
E/ky − y0 k → 0 quando y → y0 o que a desigualdade anterior permite reduzir a mostrar que
kx−x0 k
ky−y0 k é limitado para x numa vizinhança de x0 e que G é contı́nua em x0 (o que garante que
E/kx − x0 k → 0 quando y → y0 ). Quanto à primeira destas questões observamos que
kx − x0 k kx − x0 k 1
= ≤
ky − y0 k kDF (x0 )(x − x0 ) + o(kx − x0 k)k 2kDF (x0 )k−1
ko(kx−x0 k)k
em que no último passo escolheu-se x numa vizinhança de x0 de forma a termos kx−x0 k ≤
1 kAxk 1
2kDF (x0 )k−1 eusou-se a estimativa ≥ x k válida para um operador linear não singular
kA−1 k
n n
A : R → R (demonstre-a!). Quanto à continuidade de G em y0 deixamos ao cuidado do leitor
estabelecer que estimativas já obtidas permitem afirmar que dado > 0 existem com 0 < <
e r > 0 tais que ky − y0 k < r e kx − x0 k < implicam kTy (x) − x0 k < . Consequentemente,
por indução obtém-se que kTyk (x0 ) − x0 k < para todo o k ∈ N e por passagem ao limite
kG(y) − G(y0 )k < .
Provou-se assim:
Teorema 4.3.1 (Função Inversa)
Seja F : U ⊂ Rn → Rn uma função de classe C 1 (U ) em que U é um aberto e seja x0 ∈ U tal que
DF (x0 ) é não singular, isto é,
det DF (x0 ) 6= 0.
Então
i) existem vizinhanças V de x0 e W de F (x0 ) tais que F é uma bijecção de V sobre W e portanto
−1
F|V : W → V está bem definida;
−1
ii) G = F|V ∈ C 1 (W );
−1
iii) a derivada da função G = F|V no ponto y = f (x) verifica
D(G)(y) = (DF (x))−1 ,

para todo o x ∈ V ou todo o y ∈ W . Adicionalmente se F ∈ C k (U ) com k ∈ N ou k = ∞
então G ∈ C k (W ).
Convém acentuar que o teorema da função inversa não garante invertibilidade global e não é
susceptı́vel de ser melhorado nesse sentido devido a exemplos como o do problema 4.3.1.
Exemplo 4.3.3 Consideremos a função f : R2 \ {(0, 0)} → R2 definida por

f (x, y) = xy, y 2 − x2 .

O seu jacobiano8 é dado por

" #
∂f1 ∂f1
y x
det ∂x
∂f2
∂y
∂f2 = det = 2(x2 + y 2 ).
∂x ∂y
−2x 2y
8 Jacobiano é uma abreviatura de determinante da matriz jacobiana.
Como este valor é sempre positivo (notemos que a origem foi excluı́da do domı́nio), o teorema da
função inversa garante a invertibilidade local desta função. No entanto f (1, 1) = f (−1, −1) e logo
a função não pode ser globalmente invertı́vel por não ser injectiva.
Exercı́cio 4.3.2 Seja f : R2 \ {(0, 0)} → R2 definida por
f (x, y) = (xy, y 6 − x6 )
Mostre que f é localmente injectiva mas não globalmente injectiva.
Exercı́cio 4.3.3 Mostre que f : R → R2 definida por f (θ) = (cos θ, sen θ) é localmente mas não
globalmente injectiva ( não utilize o teorema da função inversa para provar injectividade local mas
sim um raciocı́nio ad hoc).
O teorema da função inversa não só garante, em determinadas condições, a existência da inversa
de uma função f , como também permite calcular, graças à garantia de diferenciabilidade numa
vizinhança, todas as derivadas de f −1 até à ordem m, o grau de diferenciabilidade de f . O exemplo
seguinte ilustra este facto:
Exemplo 4.3.4 Seja f (x) = x + x2 . O teorema da função inversa garante que f é invertı́vel
numa vizinhança de x = 0. Seja g a inversa de f . Então temos g(0) = 0 e
f (g(y)) = g(y) + g(y)2 = y.
Diferenciando a identidade anterior obtemos

∂g ∂g
(y) + 2g(y) (y) = 1. (4.8)
∂y ∂y
Portanto em y = 0 temos
∂g
(0) = 1.
∂y
Diferenciando a identidade 4.8 obtemos
∂2g ∂g ∂2g
2
(y) + 2 (y)2 2g(y) 2 (y) = 0
∂y ∂y ∂y
de onde se tira
∂2g
(0) = −2.
∂y 2
Exercı́cio 4.3.4 Calcule a inversa da função f (x) = x + x2 e confirme o resultado do exemplo

anterior.
Exemplo 4.3.5 Seja f : R → R uma função C ∞ . Se f 0 (x) 6= 0, então é possı́vel calcular todas
as derivadas de f −1 no ponto y = f (x) usando o método seguinte:
Consideremos a identidade
f f −1 (y) = y.

Derivando ambos os membros da expressão anterior obtemos, pela regra da derivação da função
composta,
∂f −1 ∂f −1
f (y) (y) = 1. (4.9)
∂x ∂y
Da equação anterior obtemos
∂f −1 1
(y) = ∂f
.
∂y ∂x (f −1 (y))
∂ 2 f −1
Para o cálculo de ∂y 2 (y) derivamos novamente (4.9), obtendo
2
∂ 2 f −1 ∂f −1 ∂f −1 2 ∂ 2 f −1

f (y) (y) + f (y) + (y) = 0,
∂x2 ∂y ∂x ∂y 2
de onde concluı́mos
∂2f
−1 2
∂ 2 f −1 ∂x2 f
−1
(y) ∂f∂y (y)
(y) = − 2 .
∂y 2 ∂f
(f −1 (y))
∂x
Assim, calculando sucessivamente as diversas derivadas de f −1 podemos desenvolver esta função

em fórmula de Taylor em torno do ponto y e portanto, numa vizinhança suficientemente pequena,
aproximá-la com precisão arbitrária.
Exercı́cio 4.3.5 Utilizando as ideias do exemplo anterior calcule
∂ 3 f −1
(y).
∂y 3
Aplicando o exemplo anterior a uma função podemos obter a fórmula de Taylor de f −1 (y) em
torno de um ponto
Exercı́cio 4.3.6 Seja f (x) = x + ex .
1. Prove que f é injectiva e portanto a inversa f −1 existe.
2. Calcule o desenvolvimento de Taylor de f −1 (y), em torno de y = f (0) = 1 até à terceira

ordem.
Para o cálculo de primeiras derivadas da inversa de uma função o teorema da função inversa
dá-nos uma expressão explı́cita, que pode ser aplicada directamente.
Exemplo 4.3.6 Seja f : R2 → R2 a função dada por
f (x, y) = x + y + x3 y − xy + 1, x − y + x4 ch y .

Sabemos que f (0, 0) = (1, 0). Podemos facilmente provar que a função f admite inversa local
definida numa vizinhança do ponto (1, 0), sendo f −1 (1, 0) = (0, 0). De facto temos
1 + 3x2 y − y 1 + x3 − x

Jf = .
1 + 4x3 ch y −1 + x4 sh y
No ponto (x, y) = (0, 0) obtemos

1 1
Df (0, 0) = .
1 −1
Assim, como det Df = −2 6= 0 e a função é de classe C ∞ existe inversa f −1 = (f1−1 , f2−1 ) também
C ∞ numa vizinhança de (u, v) = (1, 0) e verificando
" −1
∂f1−1
# −1
∂f1
−1 ∂u ∂v 1 1 1/2 1/2
Df (1, 0) = ∂f −1 ∂f −1 = = .

2 2 1 −1 1/2 −1/2
∂u ∂v (u,v)=(1,0)
Podemos também aplicar ideias semelhantes às do exemplo (4.3.5) para funções de Rn em Rn .
Utilizando um procedimento análogo, resolva então o seguinte exercı́cio:
∂ 2 f −1

Exercı́cio 4.3.7 Determine ∂u2 (u, v) com (u, v) = f (x, y) = xy, x2 − y 2 .
Com o teorema da função inversa também podemos dar uma condição de injectividade local
sobre funções de Rn → Rm , com m ≥ n, como se pode verificar no exemplo seguinte:
Exemplo 4.3.7 Se car[Df ] = n (isto é a caracterı́stica de Df ou seja o número de linhas ou

colunas linearmente independentes de Df for n) então a função f é localmente injectiva.
Seja f : Rn → Rm , com f (x) = (f1 (x), . . . , fm (x). Se car[Df ] = n no ponto x0 então existem
ı́ndices i1 , . . . , in tais que a matriz
 ∂f ∂f

i1
∂x1 . . . ∂xin1
 . .. 
 .
 . . .

∂fin ∂fin
∂x1 . . . ∂xn
tem determinante não nulo. Então, pelo teorema da função inversa a função g(x) = (fi1 , . . . , fin )
é localmente injectiva, pelo que f também será localmente injectiva.
Exercı́cio 4.3.8 Mostre, usando o exemplo anterior, que a aplicação R 3 x 7→ (sen x, cos x) é
localmente injectiva.
4.3.1 Exercı́cios Suplementares

Exercı́cio 4.3.9 Considere o sistema de equações
(
u = xy + sen(x + y),
v = e−x+y−2 + xy .
Mostre que existem vizinhanças de (u, v) = (−1, 0) e de (x, y) = (−1, 1) tais que o sistema define
(x, y) como uma função C 1 de (u, v) desde que as variáveis estejam nessas vizinhanças. Calcule
∂x
∂u (−1, 0).
Exercı́cio 4.3.10 Considere o sistema de equações não lineares

(
u = x2 y 3 + sen(x + y) − 1,
v = sen(xy) + x − y + 1.
a) Mostre que existem vizinhanças de (x, y) = (0, 0) e de (u, v) = (−1, 1) tais que aquele sistema
define (x, y) como uma função C ∞ de (u, v) em tais vizinhanças.
b) Calcule a matriz jacobiana da função cuja existência garantiu na alı́nea anterior no ponto
(−1, 1).
Exercı́cio 4.3.11 Considere a função real de variável real definida por f (x) = cos x.
1. Qual a maior vizinhança V do ponto −π/4 tal que f|V é injectiva? Calcule a inversa de f
em V .
2. Existe alguma vizinhança de π na qual a função f seja injectiva?

−1 −1 π
3. Calcule uma inversa local de f , fπ/2 , tal que fπ/2 (0) = 2.
−1 −1 3π
4. Calcule uma inversa local de f , f3π/2 , tal que f3π/2 (0) = 2 .
Exercı́cio 4.3.12 Mostre que a função f : R2 \ {(0, 0)} → R2 \ {(0, 0)} é localmente mas não
globalmente injectiva
f (x, y) = (xy, 2x2 − 5y 2 ).
0.5
-2 2 4 6
-0.5
-1
Figura 4.5: Gráfico do coseno
Exercı́cio 4.3.13 Mostre que a função f : R3 → R3 , definida por
f (x, y, z) = (sen(x + y), sen(x − y), z 3 − z 5 ),
é localmente injectiva em torno (0, 0, 0) mas que não é globalmente injectiva.

(
u = xy + sen(x + y),
v = e−x+y−2 + xy .
Mostre que existem vizinhanças de (u, v) = (−1, 0) e de (x, y) = (−1, 1) tais que o sistema define
(x, y) como uma função C 1 de (u, v) desde que as variáveis estejam nessas vizinhanças. Calcule
∂x
∂u (−1, 0).
Exercı́cio 4.3.15 Seja f : A → Rn uma função de classe C 1 , onde A é um conjunto aberto.

Prove que para cada conjunto compacto C, C ⊂ A onde Jf 6= 0 existe um número finito de
conjuntos abertos Ui tais que C ⊂ ∪Ui e f é invertı́vel em cada Ui . Sugestão: Utilize o teorema
de Heine-Borel.
Exercı́cio 4.3.16 Considere a função
f (x, y) = (sen x arccotg y, cos x arccotg y).
Prove que
1. Jf (x, y) 6= 0 para todo o x e y.
2. f não é injectiva.

4.3.11
1. Observe a figura 4.5 e repare que a restrição da função cos x ao intervalo [−π, 0] é injectiva.
2. Utilize a figura 4.5.
3. Uma inversa possı́vel será arccos x, para x ∈ [−1, 1].
4. Uma inversa nas condições requeridas é 2π − arccos x, para x ∈ [−1, 1].
J
4.3.12 Temos
y x
Df =
4x −10y
e portanto det Df = −10y 2 − 4x2 6= 0 para x, y 6= 0. Deste modo o teorema da função inversa
garante a injectividade local de f . Temos também que f (1, 1) = f (−1, −1) pelo que f não é
injectiva. J
4.3.13 Repare que a função (sen(x + y), sen(x − y)) é localmente injectiva numa vizinhança da
origem. é também fácil verificar que numa vizinhança de z = 0 a função z 3 − z 5 é injectiva.
Com estes resultados é fácil provar que f é localmente injectiva em torno da origem. f (x, y, 0) =
f (x, y, 1), pelo que f não pode ser injectiva. J
−x+y−2 x
4.3.14 Definindo f (x, y) = (xy + sen(x + y), e + y ), temos

2 0
Df (−1, 0) = .
0 2
Como o determinante desta matriz é não nulo a função é localmente invertı́vel e

−1 1/2 0
Df (−1, 1) = .
0 1/2
J
4.3.15 Como o jacobiano não se anula, para cada ponto existe uma vizinhaça Ux onde a função
é invertı́vel. O conjunto de todas estas vizinhanças é uma cobertura de C. Como este conjunto é
compacto podemos extrair uma subcobertura finita (pelo teorema de Heine-Borel). J
4.3.16 O primeiro resultado obtem-se pelo método usual, sendo o jacobiano dado por
arccotg y
Jf = − ,
1 + y2
que nunca se anula. Note que a função arccotg não está definida na origem. J
4.4 Teorema da Função Implı́cita

Frequentemente necessitamos de resolver equações na forma
f (x, y) = 0,
em ordem a x ou y. Porém, mesmo para expressões simples, esta tarefa pode ser extremamente
difı́cil. Para se convencer disto. . .
Exercı́cio 4.4.1 Tente resolver a equação
y + sen y − x = 0 (4.10)
de modo a obter y em função de x. Aparentemente não existe solução explı́cita elementar mas
nunca se sabe. . .
No entanto, conhecemos uma solução da equação 4.10, nomeadamente y = x = 0. Para além
disso numa vizinhança da origem, a função x = y + sen y tem inversa pois é injectiva. Portanto,
aplicando o teorema da função inversa, poderı́amos mostrar a existência de uma função y(x) tal
que y(x) + sen(y(x)) − x = 0.
Exercı́cio 4.4.2 Confirme as afirmações anteriores.
4.4. TEOREMA DA FUNÇÃO IMPLÍCITA
y
A y= 1 - x2

- 1 - x2

y=
y= - 1 - x2
Figura 4.6: A porção da circunferência x2 + y 2 − 1 = 0 ampliada em A não é um gráfico de uma função

da forma y = g(x). O mesmo acontece com a intersecção da circunferência com uma qualquer vizinhança
de (1, 0).
Nesta secção estudaremos um teorema que nos dá condições suficientes para se poder resolver
equações f (x, y) = 0, uma vez conhecidos pontos x0 e y0 para os quais f (x0 , y0 ) = 0 e que é
conhecido por teorema da função implı́cita. Este teorema é um resultado intimamente ligado ao
teorema da função inversa. De facto são equivalentes e o estabelecer essa equivalência é relativa-
mente fácil embora mostrar que o teorema da função implı́cita é uma consequência do teorema da
função inversa possa parecer, numa primeira análise, pouco natural.
Comecemos por algumas observações ainda não inteiramente precisas para estabelecer um
primeiro paralelismo entre os dois resultados. De um ponto de vista de solução de equações não
lineares, o teorema da função inversa lida, como vimos, com a solução local de equações da forma
y = F (x) em ordem a x, em que F ∈ C 1 e uma certa aplicação linear (a derivada de F ) é não
singular num ponto x0 em torno do qual a invertibilidade local é assegurada. De forma análoga, o
teorema da função implı́cita lida com a solução local de equações da forma F (x, y) = 0 em ordem
a y, em que F ∈ C 1 e uma certa aplicação linear relacionada com a derivada de F é não singular
num ponto (x0 , y0 ) em torno do qual a resolubilidade fica assegurada. Começamos por ilustrar
um tal problema numa situação em que se pode explicitamente chegar às mesmas conclusões e as
dimensões dos espaços envolvidos são as mais baixas possı́veis.
Exemplo 4.4.1 (Caso particular em dimensão 2) Considere-se a equação da circunferência

x2 + y 2 − 1 = 0. Na vizinhança de que pontos em que é verificada é que esta equação define
y como função de x? Resolvendo a equação em ordem a y, ou melhor ainda esboçando o seu
gráfico (ver a fig. 4.6), facilmente se reconhece que qualquer que seja o ponto sobre o gráfico desta
circunferência, excepto os pontos (−1, 0) e (1, 0), é possı́vel escolher uma vizinhança suficiente
√
2
√ ponto cuja intersecção com o conjunto definido pela equação verifica y = 1 − x
pequena desse
2
ou y = − 1 − x . É o que se ilustra na fig. 4.6 em B. Por outro lado numa vizinhança de um
dos dois pontos excepcionais tal é sempre impossı́vel, é o que se ilustra na fig. 4.6 em A.
O carácter excepcional dos pontos (1, 0) e (−1, 0) obviamente tem a ver com o facto da tangente
à circunferência nestes pontos ser vertical ou, se recordarmos que o gradiente de uma campo
escalar é ortogonal às suas linhas de nı́vel, com o facto de designando f (x, y) = x2 + y 2 − 1 temos
∂f ∂f
∂y (1, 0) = ∂y (−1, 0) = 0.
Uma outra fonte de inspiração para compreender este tipo de problemas é a álgebra linear.
Exemplo 4.4.2 (Caso linear) Seja T uma transformação linear de Rm+n em Rm , com n, m ≥
1. Suponhamos que T (x) = Ax onde A é uma matriz m × (m + n). Se car A = m (recorde que
a caracterı́stica de A, car A, é o número de linhas ou colunas linearmente independentes) então a
equação T (x) = 0 permite definir m coordenadas de x em função das restantes n.
Observemos agora alguns factos. Primeiro, temos T (0) = 0. Segundo, se car A = m então
existem m colunas linearmente independentes. Podemos, sem perda de generalidade, supor que são
as m primeiras (se isto não fosse verdade seria sempre possı́vel permutar as colunas da matriz,
fazendo uma mudança de variáveis). A matriz A pode ser escrita como
 
a11 . . . a1m . . . a1 m+n
A =  ... .. ..
.
 
. .
am1 ... amm ... am m+n
A derivada de T em ordem às primeiras m variáveis, (x1 , . . . , xm ), é representada pela matriz

 
a11 . . . a1m
Ã =  ... .. 

. 
am1 . . . amm
e det Ã 6= 0. Note que é o facto de Ã ter determinante não nulo que permite determinar as
primeiras m coordenadas em função das n − m restantes.
Exercı́cio 4.4.3 Resolva o sistema

 
x
1 1 −1   0
y =
1 1 1 0
z
de modo a obter x e z como função de y.

O teorema da função implı́cita, que enunciamos de seguida, generaliza (de um forma bastante
poderosa) o exemplo anterior. Vai ser conveniente no seu enunciado e para cálculos posteriores
∂(f ,f ,...,f )
introduzir a notação ∂(xji1 ,xji2 ,...,xjik ) , com 1 ≤ j1 < j2 < · · · < jk ≤ m, 1 ≤ i1 < i2 < · · · < ik ≤ n,
1 2 l
para representar a derivada de uma função que se obtém de uma função dada f : A ⊂ Rn → Rm
só considerando k das suas componentes fj1 , fj2 , . . . , fjk e fixando n − l das suas variáveis, ou
seja considerando-a só como função de l variáveis xi1 , xi2 , . . . , xil . Tal derivada é representada
pela submatriz da matriz jacobiana correspondente a considerar as colunas de ı́ndices i1 , i2 , . . . , ik
e as linhas de ı́ndices j1 , j2 , . . . , jk a que também nos referiremos usando a mesma notação. No
exemplo 4.4.2 podı́amos ter escrito Ã = ∂(x1∂T ,...,xn ) .
Teorema 4.4.1 (Função Implı́cita)

Seja f : U ⊂ Rn × Rm → Rm uma função de classe C p (int U ). Suponha-se que, no ponto
(x0 , y0 ) ∈ int U (x0 ∈ Rn e y0 ∈ Rm ) verifica-se f (x0 , y0 ) = 0 e
∂f
det (x0 , y0 ) 6= 0.
∂y
Então, existe uma vizinhança V de x0 na qual a equação
f (x, y) = 0
y v=f(x,y)

f(x,y) = 0
F -1
x x
F(x,y) = (x,f(x,y))
Figura 4.7: Na demonstração do teorema da função implı́cita pelo processo sugerido note que a função
é construı́da pela composição das funções x 7→ (x, 0), F −1 e (x, y) 7→ y por esta ordem. Claro que F −1
designa uma inversa local.
define uma única função g ∈ C p (V ), g : V ⊂ Rn → Rm , para a qual
f (x, g(x)) = 0
para todo o x ∈ V . Adicionalmente, a derivada de g em V satisfaz

−1
∂f ∂f
Dg(x) = − (x, g(x)) (x, g(x)). (4.11)
∂y ∂x
Notemos que o resultado do teorema é local, ao contrário do exemplo 4.4.2 que é global, isto
é se car A = m, podemos sempre resolver a equação Ax = 0 em ordem a m coordenadas. No
entanto, isto só é válido porque o sistema naquele exemplo é linear. Em geral não temos nenhuma
garantia de que possamos resolver uma equação da forma F (x, y) = 0 em ordem, por exemplo,
a y, para qualquer valor de x, mesmo que num dado ponto sejam verificadas as condições do
teorema da função implı́cita (o teorema apenas garante a existência de soluções na vizinhança do
ponto).
O teorema da função implı́cita pode ser demonstrado de uma forma análoga à do teorema
da função inversa por linearização e aproximações sucessivas. É, no entanto, muito mais simples
demonstrá-lo à custa do teorema da função inversa.
Problema 4.4.1 Demonstre o teorema da função implı́cita. Para tal, usando as convenções
do enunciado do teorema, considere a aplicação F : U ⊂ Rn × Rm → Rn × Rm definida por
F (x, y) = (x, f (x, y)) e aplique-lhe o teorema da função inversa relativamente ao ponto (x0 , y0 ).
Exemplo 4.4.3 Consideremos a equação f (x, y) = x2 + y + sen(x2 + y 2 ) = 0. Então como

f (0, 0) = 0 e ∂f
∂y (0, 0) = 1 6= 0, existe uma função g(x), definida para |x| suficientemente pequeno
tal que f (x, g(x)) = 0. Para além disto temos
∂f
∂g ∂x (0, 0)
(0) = − ∂f = 0.
∂x ∂y (0, 0)
Exemplo 4.4.4 Consideremos o sistema

(
x + y + xyz = 0,
x − y + xz + yz = 0.
Vamos agora estudar a existência de funções X(z) e Y (z) tais que X(0) = Y (0) = 0 e para z
numa vizinhança da origem, (x, y, z) = (X(z), Y (z), z) seja solução do sistema. Defininido
f (x, y, z) = (f1 (x, y, z), f2 (x, y, z)) = (x + y + xyz, x − y + xz + yz),
temos " #
∂f1 ∂f1
∂x (0, 0, 0) ∂y (0, 0, 0) 1 1
A= ∂f2 ∂f2 = .
∂x (0, 0, 0) ∂y (0, 0, 0)
1 −1
Como det A 6= 0 o teorema da função implı́cita garante a existência das funções X(z) e Y (z). Se
estivermos interessados em calcular as derivadas de X e Y a expressão para estas será
0 −1 ∂f1
X (0) 1 1 ∂z (0, 0, 0)
= .
Y 0 (0) 1 −1 ∂f2
∂z (0, 0, 0)
Exercı́cio 4.4.4 Mostre que a equação

sen x + sen y + sen z 0
=
sen x − sen y + sen3 z 0
admite uma solução da forma (x, y, z) = (X(z), Y (z), z), para |z| suficientemente pequeno, onde
X(z) e Y (z) são funções convenientes que verificam X(0) = Y (0) = 0. Calcule
∂X
(0).
∂z
Exercı́cio 4.4.5 Mostre que a equação sen x + y = 0 não tem solução x(y) definida para to-
dos valores de y. Porque que é que isto não contradiz o teorema da função implı́cita apesar de
d sen x
dx |x=0 6= 0 e sen 0 + 0 = 0?
O facto de não serem cumpridas as condições do teorema da função implı́cita não implica que
na vizinhança de um ponto não exista solução (ou que ela não seja única) de uma determinada
equação, tal como se pode verificar pelo exemplo seguinte:
Exemplo 4.4.5 Consideremos a equação
f (x, y) = x3 − y 3 = 0.
É facil verificar que f (0, 0) = 0. É também imediato que ∂f ∂f

∂x (0, 0) = ∂y (0, 0) = 0. Assim não
estamos nas condições do teorema da função implı́cita. No entanto a equação tem solução global,
única e diferenciável x = y.
O seguinte exercı́cio mostra que é possı́vel generalizar ligeiramente o teorema da função implı́cita
de modo a tratar casos semelhantes ao anterior.
Exercı́cio 4.4.6 Seja f : R2 → R uma função de classe C 1 , g, h : R → R funções contı́nuas

bijectivas. Mostre que se f (0, 0) = 0, h(0) = g(0) = 0 e ∂f ∂y (0, 0) 6= 0 então para x numa
vizinhança da origem a equação
f (g(x), h(y)) = 0
pode ser unicamente resolvida em ordem a y, sendo a solução da forma y = j(x) com j : R → R
uma função real de variável real.

(
sen(x + y + z) = z 4
x − y + z = sen(x4 + y 4 + z 4 ).
1. Prove que existem funções reais e diferenciáveis gx (z) e gy (z), definidas para |z| suficien-
temente pequeno, tais que gx (0) = gy (0) = 0 e (x, y, z) = (gx (z), gy (z), z)) é solução do
sistema.
2. Calcule gx0 (0) e gy0 (0).
3. Desenvolva gx em série de Taylor até à terceira ordem.
Exercı́cio 4.4.8 Seja α ∈ R e considere as funções fα : R3 → R definidas por
fα (x, y, z) = αz ch(x + y + z) − x2 ey
1. Determine para que valores de α a equação fα (x, y, z) = 0 define implicitamente, numa

vizinhança da origem, uma função z = Ψα (x, y)
2. Verifique que as funçoes Ψα têm um ponto de estacionaridade na origem, isto é, ∇Ψα (0, 0) =
0.
Exercı́cio 4.4.9 Considere a equação
kxk2 Ax = f (x, )
onde x ∈ Rn , ∈ Rk , A é uma matriz n × n não singular e f : Rn+k → Rn uma função C ∞ .

Mostre que se se verificar
f (x, )
lim lim =0
→0 kxk→0 kxk3
a primeira equação define x como função diferenciável de para (x, ) numa vizinhança de (0, 0).
Exercı́cio 4.4.10 (Função Implı́cita Topológica) Seja f : R2 → R, contı́nua. Suponha que

para cada x fixo se tem
lim f (x, y) = −∞ lim f (x, y) = +∞.

y→−∞ y→+∞
1. Prove que existe pelo menos uma função y(x) tal que f (x, y(x)) = 0 para todo o x ∈ R.
2. Dê um exemplo em que a função y(x) não seja única
3. Dê um exemplo em que a função y(x) não seja contı́nua.

4.4.7
1. Defina u(x, y, z) = sen(x + y + z) − z 4 e v(x, y, z) = x − y + z − sen(x4 + y 4 + z 4 ). Observe
que u(0, 0, 0) = v(0, 0, 0) = 0 e que
" #
∂u ∂u
∂x (0, 0, 0) ∂y (0, 0, 0) 1 1
∂v ∂v =
∂x (0, 0, 0) ∂y (0, 0, 0)
1 −1
tem determinante não nulo. Portanto podemos aplicar o teorema da função implı́cita.
2. gx0 (0) = −1 e gy0 (0) = 0

3. gx (z) = −z + O(z 4 ).
J
4.4.9 Aplique o teorema da função implı́cita à equação
f (x, )
Ax =
kxk2
e mostre que este problema é equivalente ao original. J

4.4.10
1. Utilize o teorema de Bolzano.

2. Escolha f de modo a que para cada x tenha pelo menos dois zeros, y1 (x) e y2 (x), distintos.
3. Utilize a função da alı́nea anterior e defina
(
y1 (x) se x > 0,
y(x) =
y2 (x) caso contrário.
Bibliografia
[1] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.

[2] F. R. Dias Agudo. Lições de Análise Infinitesimal: I. Cálculo Diferencial em Rn . 1977.
[3] Luı́s Torres Magalhães. Integrais Múltiplos. Texto Editora, Lisboa, 2a edição, 1996.
[4] Luı́s Torres Magalhães. Álgebra Linear. Texto Editora, Lisboa, 1985.
[5] Luı́s Torres Magalhães. Integrais em Variedades. Texto Editora, Lisboa, 1994.
[6] Luı́s Torres Magalhães. Complementos de Cálculo Diferencial em Rn . AEIST, Lisboa, 1983.
69
Índice
aberto, 8 definida negativa, 39

aproximações sucessivas, 54 definida positiva, 39
hessiana, 34, 39
classe indefinida, 39
C 1 , 14 jacobiana, 14
C ∞ , 20 semidefinida negativa, 39
C k , 19 semidefinida positiva, 39
compacto, 10
convexo, 53 norma, 52
de um vector de Rn , 7
derivada, 12 de uma aplicação linear, 52
direccional, 13 de uma matriz, 52
dirigida, 13 normas equivalentes, 10
de ordem superior à primeira, 21
parcial, 13 polinómio
de ordem superior à primeira, 19 de Taylor, 23
diferenciabilidade, 12 homogéneo, 22
direcções singulares, 42 ponto
crı́tico, 30
fórmula de estacionaridade, 30
de Taylor, ver teorema de Taylor de sela, 31
fechado, 9 pré-imagem, 48
fecho, 10
forma resto da fórmula de Taylor, 23
de grau k, 41
quadrática série
definida negativa, 39 absolutamente convergente, 55
definida positiva, 39 Schwarz, 20
indefinida, 39 sistema de estacionaridade, 27, 40
semidefinida negativa, 39
semidefinida positiva, 39 Taylor, 23
fronteira, 10 teorema
função da função inversa, 53
diferenciável, 7, 12 de Lagrange, ver teorema do valor médio
implı́cita, 63 de Schwarz, 20
inversa, 50 de Taylor, 23
do valor médio
gradiente, 16 para funções vectoriais, 52
para funções escalares, 17
interior, 10
inversa local, 54 Weierstrass, 29
jacobiano, 57
método de Newton, 54
matriz
70

Exercicios de Diferencial e Integral de Funçoes

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Exercicios de Diferencial e Integral de Funçoes

Enviado por

Direitos autorais:

Formatos disponíveis

Exercı́cios de Cálculo Diferencial e Integral de Funções

Diogo Aguiar Gomes, João Palhoto Matos e João Paulo Santos

2 Complementos de Cálculo Diferencial 7

4 Teoremas da Função Inversa e da Função Implı́cita 47

1.2 Futura introdução

Lisboa, Outubro de 1999

DG, JPM, JPS

onde limx→x0 o(x−x

Exercı́cio 2.1.1 Prove que as seguintes funções são normas em R2 :

Definição 2.1.2 Em Rn , a bola (aberta) centrada em x e de raio r, relativa à norma k · k, é o

B(x, r) = {y ∈ Rn : kx − yk < r}.

Exercı́cio 2.1.3 Esboce as bolas B1 (0) em R2 para as seguintes normas:

Definição 2.1.3 Diz-se que um conjunto A ⊂ Rn é aberto se verificar a seguinte propriedade:

Exercı́cio 2.1.5 Mostre que as bolas abertas são conjuntos abertos.

Temos reunidos todos os ingredientes ncessários à definição de função contı́nua:

∀ > 0 ∃δ > 0 tal que kx − yk < δ, y ∈ A ⇒ kf (x) − f (y)k < .

|x1 + y1 − x2 − y2 | ≤ |x1 − x2 | + |y1 − y2 |,

se k(x1 , y1 ) − (x2 , y2 )k < δ. Logo f é contı́nua.

Exercı́cio 2.1.6 Mostre que a função definida por

Exemplo 2.1.3 Seja f : Rn → Rm , g : Rm → Rp , f e g contı́nuas. Provemos que g ◦ f é

Exercı́cio 2.1.7 Refaça o exemplo anterior usando a definição 2.1.4.

Exercı́cio 2.1.8 Prove o teorema 2.1.1.

f −1 (A) = {x ∈ Rn : f (x) ∈ A}.

Generalize este resultado para funções definidas num subconjunto arbitrário de Rn .

Teorema 2.1.2 (Caracterização dos fechados via sucessões)

Teorema 2.1.3 (Caracterização dos compactos de Rn )

Exercı́cio 2.1.12 Dê um exemplo de uma função f : Rn → R tal que

2.1.1 Exercı́cios suplementares

akxkα ≤ kxkβ ≤ bkxkα

Exercı́cio 2.1.14 Prove que as seguintes funções são contı́nuas:

Exercı́cio 2.1.15 Prove que (

Exercı́cio 2.1.17 As definições de aberto e função contı́nua dependem aparentemente de usarmos

2.1.2 Sugestões para os exercı́cios

6. Se f é contı́nua então f e −f são semicontı́nuas inferiores.

2.2 Cálculo diferencial elementar

Definição 2.2.1 Seja U ⊂ Rn um aberto. Diz-se que uma função f : U → Rm é diferenciável no

Definição 2.2.2 A aplicação linear A da definição 2.2.1 designa-se por derivada de f em x0

Exercı́cio 2.2.1 Suponha f : U ⊂ Rn → Rm é diferenciável num ponto x0 ∈ int U . Prove que

f (x0 + h) = f (h0 ) + Df (x0 )(h) + o(h),

onde limh→0,h∈Rm o(h)

ou m for igual a 1. Se n = 1 é comum usar f 0 (x0 ) em vez de Df (x0 ).

|(x + h)3 − x3 − 3x2 h| |3xh2 + h3 |

A verificação da diferenciabilidade usando directamente a definição pode ser, mesmo em casos

Exercı́cio 2.2.3 Mostre que qualquer função diferenciável é contı́nua.

Consideremos uma função f : U ⊂ Rn → Rm e fixemos um vector v ∈ Rn . Dado um ponto

Definição 2.2.4 Define-se a derivada dirigida da função f : U ⊂ Rn → Rm no ponto x0 ∈ U ,

f (x0 + λv) − f (x0 )

Exemplo 2.2.2 Consideremos a função definida por

As derivadas direccionais de funções f : U ⊂ Rn → R na direcção dos eixos coordenados e no

Definição 2.2.5 Seja f : U ⊂ Rn → R. A derivada parcial de f em relação a xi é definida, caso

Analisando a definição facilmente se conclui que, em termos práticos, a derivada parcial de f

Exercı́cio 2.2.4 Calcule a derivada parcial em ordem a y das seguintes funções

Se uma função é diferenciável as derivadas parciais permitem construir facilmente a matriz

A diferenciabilidade de uma função pode ser estabelecida facilmente à custa da continuidade

Definição 2.2.6 Diz-se que uma função f : U ⊂ Rn → Rm com U aberto é de classe C 1 (U ) se

Exemplo 2.2.5 Calculemos a derivada da função

f (x, y, z, w) = (f1 , f2 , f3 ) = (x + y, x + y + z 2 , w + z).

Aplicando os resultados e observações anteriores temos

pelo que a função é C 1 , logo diferenciável e a derivada é representada pela matriz Jf .

Proposição 2.2.2 (C 1 implica diferenciabilidade)

f (x + h, y + k) − f (x, y) = [f (x + h, y + k) − f (x, y + k)] + [f (x, y + k) − f (x, y)].

1. f (x, y, z) = (x2 − y 2 , xy)

3. f (x, y) = (sen(x + y), cos(x − y))

4. f (x, y) = (ex+y+z , log(1 + ey ), z 2 + x)

∀ > 0 ∃δ > 0 tal que kx − yk < δ, y ∈ A ⇒ kf (x) − f (y)k < .