Você está na página 1de 15

TEOREMAS DE FUNÇÃO INVERSA,

CONTRACÇÃO E FUNÇÃO IMPLÍCITA


a propósito de soluções de equações

Luis T. Magalhães

IST

31.MAR.2016

1 / 15
Teoremas de Função Inversa e Função Implı́cita
Motivação
Em geral não se consegue resolver explicitamente equações f(x) = y em
termos de funções elementares do cálculo. Exceptuam-se os casos em
que f é uma transformação linear, ou de equações escalares em que é
uma função polinomial de grau ≤ 4 , ou os que podem ser reduzidos a
esses casos por mudanças de variáveis ou simetrias.
Como a resolução de equações é importante, convém estudar as soluções
mesmo sem ser possı́vel obtê-las explicitamente (e.g. se existem ou não,
quantas são, como obter conjuntos a que pertençam, como calcular
computacionalmente aproximações).
É natural considerar a extensão de sistemas de equações lineares com
solução única, ou seja quando se pode garantir que f tem inversa, pois
então a solução é x = f −1 (y) . Como o gráfico de uma função f
diferenciável é tangente num ponto (a, f(a)) a um plano translação do
gráfico de f ′ (a) de 0 para (a, f(a)) , é de esperar que se Df(a) é não
singular, i.e. f ′ (a) é invertı́vel, também a restrição de f a uma vizinhança
de a seja invertı́vel. Esta é a ideia do Teorema da Função Inversa.
O Teorema da Função Implı́cita corresponde à extensão análoga de
sistemas de equações lineares com infinitas soluções, dadas obtendo
algumas das incógnitas como função das outras (das incógnitas livres). 2 / 15
Teorema de Existência de Inversa Local
Se f : S → Rn , S ⊂ Rn , f é diferenciável em S, Df é contı́nua num
ponto a ∈ S, e Jf(a) 6= 0 , então existe um conjunto aberto X ⊂ S
com a ∈ X tal que a restrição f|X tem inversa.
Dem. Sem perda de generalidade a = 0 , f(a) = 0 , Df(a) = In (translação
de coordenadas no domı́nio e no espaço de chegada de modo ao ponto
a, f(a) passar para a origem, e composição de [f ′ (a)]−1 com f ).


Prova-se que ∃R>0 : f|BR (a) é injectiva. Com G(x) = x−f(x) , é G(a) = 0 ,
DG(a) = 0 e f(y) = f(x) ⇔ y−x = G(y)−G(x) .
Aplicando o T. de Lagrange e a desigualdade de Cauchy-Schwarz a cada
componente, para alguns ck no segmento de recta de x a y é
|Gk (y)−Gk (y)| = |∇Gk (ck ) · (y−x)| ≤ k∇Gk (ck )kky−xk , k = 1, . . . , n .
Como G é diferenciável em S, ∇Gk é contı́nua em a e ∇Gk (a) = 0 ,
1
∃Rk >0 : k∇Gk (ck )k < 2n , k = 1, . . . , n ; logo, se R = min{R1 , . . . , Rn }, é
kG(y)−G(x)k ≤ nkG(y)−G(x)k∞ ≤ 12 ky−xk para x, y ∈ BR (a) . Portanto,
f(y) = f(x), x, y ∈ BR (a) ⇒ ky−xk ≤ 21 ky−xk ⇒ ky−xk = 0 ⇒ y = x .
Conclui-se que ∃R>0 : f é injectiva em BR (a) . Q.E.D.
3 / 15
Soluções de equações e pontos fixos de funções associadas
Pretende-se provar que nas condições do resultado precedente existe
X ⊂ S tal que f −1 = [f|X ]−1 é diferenciável num conjunto aberto Y ,
pois então, mesmo sem fórmula explı́cita para f −1 , a regra da cadeia
aplicada a f −1 ◦ f = 1X dá Df −1 (y) Df(x) = In com y = f(x) ; logo,
Df −1 (y) = [Df(x)]−1 .
É preciso provar que X pode ser tal que Y = f(X ) é aberto.
Observa-se que
f(x) = y ⇐⇒ Qy (x) = x , com Qy (x) = x−f(x)+y
(x é solução da equação f(x) = y se e só se é ponto fixo da função Qy )
O objectivo pode ser conseguido observando que uma função que contrai
distâncias num conjunto fechado tem um único ponto fixo no conjunto,
que é o limite de sucessões obtidas por aplicação sucessiva da função a
partir de um ponto qualquer, o que também dá um método para cálculo
computacional da função inversa. A ideia aplica-se em condições mais
gerais para obter a existência e unicidade de soluções de equações e
calculá-las aproximadamente.
Como o limite é desconhecido, precisamos de poder decidir que uma
sucessão converge comparando termos da sucessão em vez de os
comparar com o limite. 4 / 15
Sucessões de Cauchy

Chama-se sucessão de Cauchy em Rn a {uk } ⊂ Rn tal que


∀ε>0 ∃N∈N : k, m > N ⇒ kuk −um k < ε . (análogo em espaços métricos)

{uj } ⊂ Rn converge ⇔ {uj } é sucessão de Cauchy.


Dem. (⇒) Se uj → b, é ∀ε>0 ∃N∈N : k, m > N ⇒ kuk −bk, kum −bk < ε .
Da desigualdade triangular, ∀ε>0 ∃N∈N : k, m > N ⇒ kuk −um k < 2ε ; logo,
{uj } é sucessão de Cauchy.
(⇐) (em R) Se {uj } é sucessão de Cauchy, ∃N∈N : k, m > N ⇒ kuk−um k < 1.
Da desigualdade triangular, k, m > N ⇒ |um | ≤ |um −uk |+|uk | < 1+|uk | .
Logo, |uj | ≤ max{|u1 |, . . . , |uN+1 |, 1+|uN+1|} ∀j ∈ N . Portanto, a sucessão
{uj } ⊂ R é limitada. Do axioma do supremo para no s reais, existem
sj = inf{uk : k ≥ j} , Sj = sup{uk : k ≥ j} . As sucessões {sj }, {Sj } são
limitadas e são, resp., crescente e decrescente. Logo, têm, resp., supremo
s ∗ e ı́nfimo S ∗ , que são os resp. limites; logo, tendo em conta que {uj } é
sucessão de Cauchy, obtém-se
∀ε>0 ∃N∈N : j > N ⇒ |sj −s ∗ |, |Sj −S ∗ |, |Sj −sj | < ε , e da desiguldade
triangular, S ∗ −s ∗ < 3ε . Como ε > 0 é arbitrário, uj → S ∗ = s ∗ .
(em Rn , n > 1) Aplica-se o precedente a cada componente e usa-se a
equivalência das normas k k e k k∞ . Q.E.D. 5 / 15
Espaços completos

O resultado precedente falha em Q .

Diz-se que um espaço linear normado V é um espaço completo se todas


as sucessões de Cauchy em V convergem (análogo em espaços métricos).

Portanto, R com a norma de valor absoluto é um espaço normado


completo e Q não é; Rn com a norma canónica é um espaço espaço
normado completo e Qn não é.

Assim como se pode completar Q com o menor espaço completo que o


contém (que é R, e este até é um método básico de construção dos no s
reais a partir de racionais), pode-se provar que todo espaço normado
(ou métrico) pode ser completado.

6 / 15
Teorema de Contracção
Chama-se contracção em S ⊂ Rn a uma função Q : S → S tal que
∃λ∈[0,1[ : kQ(y)−Q(x)k ≤ λky−xk para x, y ∈ S .
Teorema de Contracção: Toda contracção Q num conjunto
fechado ∅ = 6 F ⊂ Rn tem um único ponto fixo em F .
Dem. Verifica-se kQk (y)−Qk (x)k ≤ λk ky−xk , com λ ∈ [0, 1[ .
Com x0 ∈ F arbitrário considera-se a sucessão com termos xk = Qk (x0 ) . É
kxk −xk+m k = kQk (x0 )−Qk+m (x0 )k = kQk (x0 )−Qk (Qm (x0 )k
Pm 
≤ λk kx0 −Qm (x0 )k = λk j=1 Qj (x0 )−Qj−1 (x0 )

Pm−1 λk
≤ λk j=0 λj Q(x0 )−x0 ≤ 1−λ Q(x0 )−x0 .
Como λk → 0 quando k → +∞ , {xk } é uma sucessão de Cauchy;
logo, convergente, xk → x∗ ∈ Rn , e, como F é fechado, é x∗∈ F .
Como Q é contı́nua, Q(xk ) → Q(x∗ ) , mas Q(xk ) = Qk+1 (x0 ) → x∗ ,
pelo que Q(x∗ ) = x∗ . Logo, ∃ ponto fixo em F .
Se Q(x∗1 ) = x∗1 e Q(x∗2 ) = x∗2 , é kx∗1 −x∗2 k = kQ(x∗1 )−Q(x∗2 )k ≤ λkx∗1 −x∗2 k .
Como λ ∈ [0, 1[ , é kx∗1 −x∗2 k = 0 e, portanto, x∗1 = x∗2 . Q.E.D.
(A convergência exponencial! Tanto mais rápida quanto λ for menor.
É válido o resultado análogo em espaços métricos completos. Aplica-se
em espaços de funções para equações diferenciais, integrais ou outras). 7 / 15
Teorema de contracção
Aplicação a resolução computacional de equações escalares:
Método de Newton-Raphson

Se f[a, b] → R, C 2 , f ′ (x) 6= 0 , |f (x) f ′′ (x)| < (f ′ (x))2 para x ∈ [a, b] ,


então f (x) = 0 tem solução única em [a, b] , que é o limite da
sucessão definida por xk+1 = xk − ff′(x(xkk)) , com x0 ∈ [a, b] qualquer.
Dem. Define-se Q(x) = x −[f ′ (x)]−1 f (x) = x − ff′(x) (x) . Verifica-se
′ 2 ′′

[f (x)] −f (x) f (x) f (x) f ′′ (x)
|Q ′ (x)| = 1− = 1−1+ [f ′ (x)]2 < 1 .

[f ′ (x)]2

Do T. de Lagrange, |Q(y )−Q(x)| = |Q ′ (c)||y −x| , para algum c entre x


e y . Como Q ′ é contı́nua em [a, b] pois Q é C 2 , do T. de Weierstrass
tem máximo em [a, b] , que, portanto, é um λ < 1 ; logo, Q é uma
contracção em [a, b] . O T. da Contracção garante que ∃ um único ponto
fixo de Q em [a, b] e, como as soluções da equação f (x) = 0 são os
pontos fixos de Q, obtém-se que ∃ uma única solução da equação,
que é o limite da sucessão {Q k (x0 )} qualquer que seja x0 ∈ [a, b] . Q.E.D.

8 / 15
Teorema de contracção
Aplicação a resolução computacional de equações escalares:
Método de Newton-Raphson – Exemplo

Se f (x) = cos x −x , é f ′ (x) = −(sin x +1) e f ′′ (x) = − cos x ,


pelo que (f ′ )2 (x) = (sin x +1)2 > 1 para x ∈ [0, 1] e
|f (x) f ′′ (x)| = |(cos x −x) cos x| ≤ | cos x −x| ≤ 1 para x ∈ [0, 1] .
Logo, f satisfaz a hipótese do resultado acima em [0, 1] .
Existe uma única solução de cos x −x = 0 e é o limite da sucessão definida
por xk+1 = xk + cos xk −xk
sin xk +1 , com x0 ∈ [0, 1] arbitrário.

Com x0 = π4 ≈ 0, 785398 , f (x0 ) ≈ −0, 07829 = 7, 8x10−2



2
2 −4
π
x1 = π4 + √
2
≈ 0, 739536 , f (x1 ) ≈ 7, 5x10−4
2 +1

x2≈0, 73908518 , f (x2 ) ≈ −7, 5x10−8


x3≈0, 73908513321516 , f (x3 ) ≈ −6, 7x10−16
(apenas em 3 iterações obtém-se uma solução aproximada da equação
em que o valor de f < 10−15 e com 4 iterações este resı́duo é < 10−31)

9 / 15
Teorema da Função Inversa
Se f : S → Rn , S ⊂ Rn , f é diferenciável em S, Df é contı́nua em a ∈ S
e Jf(a) 6= 0 , então existe X ⊂ S aberto com a ∈ X tal que:
(1) a restrição f|X tem inversa f −1 ;
(2) Y = f(X ) é aberto;
(3) f −1 é diferenciável em Y, Df −1 (y) = [Df(x)]−1 c/ x = f −1 (y), y ∈ Y ;
(4) f é C m (m ∈ N) ⇒ f −1 é C m .
Dem. (1) Já provado: sem perda de generalidade a = 0,f(a) = 0, Df(a) = In ,
e com G(x) = x−f(x) , ∃R>0 : BR (0) ⊂ S e f é injectiva em BR (0) ,
kG(y)−G(x)k ≤ 12 ky−xk para x, y ∈ BR (0) , Jf(x) 6= 0 para x ∈ BR (0) .
(2) f(x) = y ⇔ Qy (x) = x , com Qy (x) = x−f(x)+y = G(x)+y .
Verifica-se para y ∈ B R (0) e x, z ∈ BR (0) que
2

kQy (x)k = kG(x)+yk ≤ kG(x)−G(0)k+kyk ≤ 21 kxk+kyk < R2 + R2 = R


kQy (z)−Qy (x)k = kG(z)−G(x)k ≤ 21 kz−xk .
Logo, ∀y∈B R (0) : Qy é contracção em BR (0) ; do T. da Contracção,
2
∃ ponto fixo único x∗ (y) de Qy em BR (0) ; é kx∗ (y)k = kQy (x∗ (y))k < R ;
logo, x∗ (y) ∈ BR (0) . Com X = f −1 [B R (0)]∩BR (0) , é f(X ) = Y = B R (0) e
2  2
0 ∈ X . Como f é contı́nua, f −1 B R (0) é aberto; portanto, X é a

2
intersecção de 2 conjuntos abertos, e X , Y = B R (0) são abertos.
2 10 / 15
Teorema da Função Inversa (cont. da demonstração)
(3.1) f −1 é contı́nua em Y .
Se x1 = f −1 (y1 ) = Qy ((x1 ) , x2 = f −1 (y2 ) , com y1 , y2 ∈ Y , então
 
kx1 −x2 k = k G(x1 )+y1 − G(x2 )+y2 k ≤ kG(x1 )−G(x2 )k+ky1 −y2k
≤ 12 kx1−x2 k+ky1−y2 k , pelo que kf −1 (y2 )−f −1 (y1 )k ≤ 2ky1−y2 k .
−1
(3.2) f é diferenciável em Y .
Como f é diferenciável em S ⊃ X , se x, z ∈ X e y = f(x) , w =  f(z) ,
f(z)−f(x) = [Df(x)](z−x)+kz−x Ef x, z−x , c/Ef x, z−x → 0 p/z → x .
Como Jf 6= 0 em BR (0) ⊃ X , Df (x) é não singular em X .
Com A = [Df (x)]−1 , multiplicando a equação anterior à esquerda por A ,
A(w−y) = AA−1 (z−x)+kz−xk A Ef x, z−x ,
= f −1 (w)−f −1 (y) +kf −1 (w)−f −1 (y)k A Ef f −1 (y), f −1 (w)−f −1 (y) ,
 

que equivale a f −1 (w)−f −1 (y) = A(w−y)+kw−ykEf −1 (y, w−y) , com


−1 −1
Ef −1 (y, w−y) = kf (w)−f (y)k
f −1 (y), f −1 (w)−f −1 (y) .

kw−yk −1 A Ef −1
Da desigualdade em (3.1), kf (w)−f kw−yk
(y)k
≤ 2 e f −1 (w)−f −1 (y) → 0 ,
pelo que Ef f −1 (y), f −1 (w)−f −1 (y) → 0 , quando w → y ; logo,


Ef −1 (y, w−y) → 0 quando w → y , pelo que f −1 é diferenciável em y ∈ Y .


(4) Com a fórmula de inversão de matrizes com cofactores e
determinantes, como Jf 6= 0 ,
f é C m ⇒ Df é C m−1 ⇒ [Df]−1 é C m−1 ⇒ f −1 é C m . Q.E.D. 11 / 15
Aplicação aberta
Corolário do Teorema da Função Inversa

Sabe-se que as preimagens de conjuntos abertos por funções contı́nuas


são conjuntos abertos relativamente ao respectivo domı́nio (esta
propriedade caracteriza funções contı́nuas), mas as imagens de conjuntos
abertos por funções contı́nuas podem ser conjuntos abertos, fechados ou
nem abertos nem fechados. Com o Teorema da Função Inversa podem-se
obter condições simples para imagens de conjuntos abertos serem abertos.

Chama-se aplicação aberta a uma função tal que imagens de conjuntos


abertos são conjuntos abertos.

Uma função f : S → Rn , com S ⊂ Rn aberto, C 1 e com


Jf(x) 6= 0 ∀x ∈ S é uma aplicação aberta.
Dem. Se U ⊂ S é aberto e a ∈ U, do Teorema da Função Inversa
∃Y ⊂f(U) : Y é aberto e f(a) ∈ Y . Logo, se a ∈ U, então f(a) ∈ int f(U) ,
pelo que f(U) = int f(U) , e, portanto, f(U) é aberto. Q.E.D.

12 / 15
Teorema da Função Implı́cita
Motivação
Os teoremas da Função Inversa e da Função Implı́cita são equivalentes.
Aqui prova-se o 2o a partir do 1o , mas poderia ser ao contrário.

Pretendem-se condições que garantam que uma equação F(x, y) = 0 tem


infinitas soluções dadas por y em função de x (as incógnitas livres).

No caso do campo escalar em R2 , F (x, y ) = x 2 +y 2 , F (x, y ) = 0 é a


equação cartesiana da circunferência com centro 0 e raio 1 .
A correspondência de x para y não é unı́voca em vizinhanças dos pontos
(±1, 0) , mas é unı́voca em vizinhanças suficientemente pequenas dos
outros pontos da circunferência, pelo que nestas vizinhanças F (x, y ) = 0
define localmente y como função implı́cita de x ; nestes pontos
∂F ∂F
∂y (x, y ) = 2y 6= 0 , enquanto nos outros dois pontos ∂y (±1, 0) = 0 ;
neste caso, a condição ∂F ∂y (x, y ) 6= 0 garante que localmente numa
vizinhança de (x, y ) a equação define y (a incógnita em relação a que se
considera a derivada) em função de x .
Analogamente, ∂F ∂x (x, y ) 6= 0 garante que localmente numa vizinhança de
(x, y ) a equação define x (a incógnita em relação a que se considera a
derivada) em função de y . 13 / 15
Teorema da Função Implı́cita
Motivação
No caso de sistemas de m equações lineares, ou seja se F : Rn → Rm é
uma transformação linear e A é a respectiva representação matricial nas
bases canónicas, a situação descrita corresponde a rank A = m , x ∈ Rn−m ,
y ∈ Rm , com A = [A11 A12 ] , F(x, y) = A11 x+A12 y−b e A12 m×m não
singular, porque então F(x, y) = 0 ⇔ A11 x+A12 y = b tem solução geral
(x, y) com y = A−1
12 (b−A11 x) , x ∈ R
n−m
(n−m incógnitas livres).
∂F
Com derivadas parciais, A12 = ∂y (x, y) é não singular ⇔ det ∂F
∂y (x, y) 6= 0 .

Para obter o resultado com base na inversa de uma matriz não singular é
preciso estender o sistema a um outro equivalente com matriz de
coeficientes n×n , o que se pode fazer acrescentando n−m equações
independentes que sejam
 sempre verificadas,
  x= x , ou seja
 e.g.
In−m 0 x x
= .
A11 A12 y b
A matriz de coeficientes é não singular se e só se det A12 6= 0 .
Para obter o Teorema da Função Implı́cita do Teorema da Função Inversa
no caso em que a função F pode ser não linear considera-se a extensão
análoga da equação F(x, y) = 0 , obtida acrescentando a equação x = x ,
e aplica-se à equação obtida o Teorema da Função Inversa. 14 / 15
Teorema da Função Implı́cita
Se F : S → Rm , S ⊂ Rn é aberto, m < n , F é diferenciável em S, a ∈ S,
∂F
∂y (x, y) é contı́nua em a = (x0 , y0 ) ∈ R
n−m
×Rm e det ∂F ∂y (x0 , y0 ) 6= 0 ,
então existe X ⊂ S aberto com a ∈ X e U ⊂ Rn−m aberto tais que:
(1) ∃ f:U → Rm diferenciável: F(x, y) = 0 p/(x, y) ∈X ⇔ y = f(x) p/x ∈U ;
−1  ∂F
(2) Df(x) = − ∂F
 
∂y x, f(x) ∂x x, f(x) para x ∈ U ;
(3) F é C m (m ∈ N) ⇒ f é C m .
Dem. Aplicação imediata do Teoremada Função Inversa à função
h : S → Rn tal que h(x, y) = x, F(x, y) , pois Jh = det ∂F
∂y ,
e h é diferenciável em S (resp., Dh é contı́nua em a) se e só se F é.
(2) também pode ser obtida directamente aplicando a Regra da Cadeia a
F x, f(x) = ∂F
 d
   ∂F 
F x, f(x) , o que dá dx ∂x x, f(x) + ∂y x, f(x) Df(x) ,
de que é imediata a fórmula em (2). Q.E.D.

Observa-se que nas condições da hipótese deste Teorema da Função


Implı́cita podem-se obter a derivada e derivadas de ordem superior até
ordem m da função definida implicitamente, mesmo sem uma fórmula
explı́cita para essa função.
15 / 15